Extracção de Informação Semântica de Conteúdo da Web 2.0

Carvalheira, Ana Rita Bento

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/35585

Title:	Extracção de Informação Semântica de Conteúdo da Web 2.0
Authors:	Carvalheira, Ana Rita Bento
Orientador:	Gomes, Paulo Jorge de Sousa
Keywords:	Língua Portuguesa; Media Social; Pesquisa Semântica; Processamento de Linguagem Natural; Web 2 0; Web Semântica; Web Social
Issue Date:	8-Jul-2014
Serial title, monograph or event:	Extracção de Informação Semântica de Conteúdo da Web 2.0
Place of publication or event:	Coimbra
Abstract:	A massiva proliferação de blogues e redes sociais fez com que o conteúdo gerado pelos utilizadores, presente em plataformas como o Twitter ou Facebook, se tornasse bastante valioso pela quantidade de informação passível de ser extraída e explorada. No entanto, a análise de informação proveniente destas fontes apresenta bastantes desafios, devido, não só, ao curto tamanho das mensagens, mas também ao tipo de linguagem usada, que contém inúmeras abreviaturas, erros ortográficos e conteúdo específico da media social, o que dificulta significativamente a tarefa de extração de informação a partir deste texto. A presente tese visa o desenvolvimento de um conjunto de ferramentas que permitem efetuar a análise e extração de conhecimento a partir de várias fontes da Web 2.0, recorrendo ao uso de diversas técnicas de Processamento de Linguagem Natural e representando esse conhecimento através de tecnologias da Web Semântica. De forma a realizar este objetivo foi desenvolvida uma biblioteca, constituída por vários módulos que possibilitam a extração de informação semântica a partir de notícias online, blogues e publicações provenientes de redes sociais. Foi também desenvolvido um sistema cujo principal objetivo é demonstrar as funcionalidades providenciadas pela biblioteca, permitindo a realização de pesquisa e navegação sobre a informação extraída e representando-a através de tecnologias da Web Semântica. Importa ainda salientar que a biblioteca suporta unicamente a língua portuguesa (português de Portugal) o que, por si só, representa um desafio, visto existirem relativamente poucos recursos disponíveis para o português.
Description:	Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra
URI:	https://hdl.handle.net/10316/35585
Rights:	openAccess
Appears in Collections:	UC - Dissertações de Mestrado FCTUC Eng.Informática - Teses de Mestrado

Files in This Item:

File	Description	Size	Format
Extracao de Informacao Semantica de Conteudo da Web 2.0.pdf		6.24 MB	Adobe PDF	View/Open

Show full item record

Page view(s) 20

765

checked on Jul 16, 2024

Download(s) 50

557

checked on Jul 16, 2024

Google Scholar^TM

Check

Files in This Item:

Page view(s) 20

Download(s) 50

Google ScholarTM

Google Scholar^TM