Please use this identifier to cite or link to this item:
https://hdl.handle.net/10316/99713
Title: | Projeto EDUCA | Authors: | Borges, Nuno Ricardo Rodrigues | Orientador: | Gomes, Paulo J. S. | Keywords: | Classificação automática de documentos; Plataforma Web; Reconhecimento de entidades mencionadas; Repositório de conteúdos digitais; Sumarização automática de documentos | Issue Date: | 2-Jul-2013 | Place of publication or event: | Coimbra | Abstract: | O projeto EDUCA é uma plataforma informática para suportar um repositório de conteúdos multimédia para pesquisa, agregação e proteção dos conteúdos. Nesta plataforma é pretendido que seja feita a extração automática de informação, classificação e sumarização automática de documentos de texto. A extração automática de informação corresponde a obter a informações contidas no ficheiro, como titulo, data de criação, autores, entre outros. A informação aqui descrita corresponde aos metadados. No entanto, no caso de documentos de texto a informação extraído contempla também o próprio texto. A classificação automática de documentos de texto assenta na classificação dos documentos em várias categorias, permitindo depois ao utilizador pesquisar os documentos por categoria. No caso da sumarização automática de texto tem como objetivo criar um resumo do documento. A existência de um resumo sobre um qualquer documento indica ao utilizador sobre o que é que o documento retrata. A abordagem que é pretendida seguir na classificação automática de documentos é semi-supervisionada, tendo como expectativa tirar partido de análises anteriores, para melhorar as análises posteriores. No caso da sumarização de documentos a abordagem será superficial, ou seja, uma com base estatística. O presente relatório pretende mostrar todo o trabalho desenvolvido pelo estagiário ao longo do estágio, para resolver os problemas de classificação e sumarização automática de documentos de texto. | Description: | Dissertação e Relatório Final Estágio do Mestrado Engenharia Informática apresentado à Faculdade de Ciências e Tecnologia da Universidade de Coimbra. | URI: | https://hdl.handle.net/10316/99713 | Rights: | openAccess |
Appears in Collections: | FCTUC Eng.Informática - Teses de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Nuno_Ricardo_Rodrigues_Borges_2007183992_Projeto_EDUCA.pdf | 2.35 MB | Adobe PDF | View/Open |
Page view(s)
74
checked on Oct 15, 2024
Download(s)
38
checked on Oct 15, 2024
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.