Please use this identifier to cite or link to this item:
http://hdl.handle.net/10316/35585
Title: | Extracção de Informação Semântica de Conteúdo da Web 2.0 | Authors: | Carvalheira, Ana Rita Bento | Orientador: | Gomes, Paulo Jorge de Sousa | Keywords: | Língua Portuguesa; Media Social; Pesquisa Semântica; Processamento de Linguagem Natural; Web 2 0; Web Semântica; Web Social | Issue Date: | 8-Jul-2014 | Serial title, monograph or event: | Extracção de Informação Semântica de Conteúdo da Web 2.0 | Place of publication or event: | Coimbra | Abstract: | A massiva proliferação de blogues e redes sociais fez com que o conteúdo gerado pelos utilizadores, presente em plataformas como o Twitter ou Facebook, se tornasse bastante valioso pela quantidade de informação passível de ser extraída e explorada. No entanto, a análise de informação proveniente destas fontes apresenta bastantes desafios, devido, não só, ao curto tamanho das mensagens, mas também ao tipo de linguagem usada, que contém inúmeras abreviaturas, erros ortográficos e conteúdo específico da media social, o que dificulta significativamente a tarefa de extração de informação a partir deste texto. A presente tese visa o desenvolvimento de um conjunto de ferramentas que permitem efetuar a análise e extração de conhecimento a partir de várias fontes da Web 2.0, recorrendo ao uso de diversas técnicas de Processamento de Linguagem Natural e representando esse conhecimento através de tecnologias da Web Semântica. De forma a realizar este objetivo foi desenvolvida uma biblioteca, constituída por vários módulos que possibilitam a extração de informação semântica a partir de notícias online, blogues e publicações provenientes de redes sociais. Foi também desenvolvido um sistema cujo principal objetivo é demonstrar as funcionalidades providenciadas pela biblioteca, permitindo a realização de pesquisa e navegação sobre a informação extraída e representando-a através de tecnologias da Web Semântica. Importa ainda salientar que a biblioteca suporta unicamente a língua portuguesa (português de Portugal) o que, por si só, representa um desafio, visto existirem relativamente poucos recursos disponíveis para o português. | Description: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra | URI: | http://hdl.handle.net/10316/35585 | Rights: | openAccess |
Appears in Collections: | UC - Dissertações de Mestrado FCTUC Eng.Informática - Teses de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Extracao de Informacao Semantica de Conteudo da Web 2.0.pdf | 6.24 MB | Adobe PDF | View/Open |
Page view(s) 20
718
checked on Mar 20, 2023
Download(s) 50
442
checked on Mar 20, 2023
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.