Please use this identifier to cite or link to this item: http://hdl.handle.net/10316/35585
Title: Extracção de Informação Semântica de Conteúdo da Web 2.0
Authors: Carvalheira, Ana Rita Bento 
Orientador: Gomes, Paulo Jorge de Sousa
Keywords: Língua Portuguesa; Media Social; Pesquisa Semântica; Processamento de Linguagem Natural; Web 2 0; Web Semântica; Web Social
Issue Date: 8-Jul-2014
Serial title, monograph or event: Extracção de Informação Semântica de Conteúdo da Web 2.0
Place of publication or event: Coimbra
Abstract: A massiva proliferação de blogues e redes sociais fez com que o conteúdo gerado pelos utilizadores, presente em plataformas como o Twitter ou Facebook, se tornasse bastante valioso pela quantidade de informação passível de ser extraída e explorada. No entanto, a análise de informação proveniente destas fontes apresenta bastantes desafios, devido, não só, ao curto tamanho das mensagens, mas também ao tipo de linguagem usada, que contém inúmeras abreviaturas, erros ortográficos e conteúdo específico da media social, o que dificulta significativamente a tarefa de extração de informação a partir deste texto. A presente tese visa o desenvolvimento de um conjunto de ferramentas que permitem efetuar a análise e extração de conhecimento a partir de várias fontes da Web 2.0, recorrendo ao uso de diversas técnicas de Processamento de Linguagem Natural e representando esse conhecimento através de tecnologias da Web Semântica. De forma a realizar este objetivo foi desenvolvida uma biblioteca, constituída por vários módulos que possibilitam a extração de informação semântica a partir de notícias online, blogues e publicações provenientes de redes sociais. Foi também desenvolvido um sistema cujo principal objetivo é demonstrar as funcionalidades providenciadas pela biblioteca, permitindo a realização de pesquisa e navegação sobre a informação extraída e representando-a através de tecnologias da Web Semântica. Importa ainda salientar que a biblioteca suporta unicamente a língua portuguesa (português de Portugal) o que, por si só, representa um desafio, visto existirem relativamente poucos recursos disponíveis para o português.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra
URI: http://hdl.handle.net/10316/35585
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado
FCTUC Eng.Informática - Teses de Mestrado

Files in This Item:
File Description SizeFormat
Extracao de Informacao Semantica de Conteudo da Web 2.0.pdf6.24 MBAdobe PDFView/Open
Show full item record

Page view(s) 20

629
checked on Feb 18, 2020

Download(s)

161
checked on Feb 18, 2020

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.