Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/88030
DC FieldValueLanguage
dc.contributor.advisorOliveira, Hugo Ricardo Gonçalo-
dc.contributor.authorFerreira, João Diogo Coelho-
dc.date.accessioned2019-11-18T23:34:10Z-
dc.date.available2019-11-18T23:34:10Z-
dc.date.issued2019-09-13-
dc.date.submitted2019-11-18-
dc.identifier.urihttps://hdl.handle.net/10316/88030-
dc.descriptionDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractO processamento de linguagem natural é uma área que tem aplicações muito vastas, que vão desde resumo de texto automatizado à tradução automática e criação de agentes conversacionais. Para a criação destas aplicações é necessário utilizar diversas ferramentas complexas que permitam processar grandes quantidades de informação. Actualmente, a maioria opera principalmente sobre a língua inglesa, e embora possam ser treinadas para a língua portuguesa podem ser amplamente melhoradas, para mais se determinadas nuances da língua forem consideradas. Justifica-se por esse motivo a necessidade de criar ferramentas que operem especificamente sobre a língua portuguesa e assim obter melhores resultados.O presente trabalho propõe o desenvolvimento de ferramentas que permitam processar texto em português e posteriormente transformá-lo em formatos sobre os quais agentes conversacionais consigam operar.Para isso, foram estudadas ferramentas de processamento de linguagem natural já existentes, e após este estudo iniciaram-se adaptações de modo a tentar obter melhores resultados para língua portuguesa. Este trabalho continuará com a integração de ferramentas que permitam extrair informação e culminará com uma demonstração da sua aplicação à geração de pares de perguntas e respostas, o que poderá ser útil para aplicações como agentes conversacionais.Neste trabalho foi desenvolvida e disponibilizada ao público uma nova cadeia de PLN para a língua portuguesa, utilizando a linguagem de programação Python.por
dc.description.abstractNatural Language Processing is an area that has very extensive applications, that range from automated text summarization to automatic translation and conversational agents' creation. In order to create these applications, it is necessary to use several complex tools that allow to process large amounts of information. Nowadays, most of these tools operate mainly on the English language and, even though they can be trained to operate in the Portuguese language, they can be vastly improved, especially if some language nuances are considered. This justifies the need to create tools that can operate specifically on the Portuguese language and thus get better results.The work presented in this document proposes the development of tools that allow text processing in Portuguese and later its' transformation into formats on which conversational agents can operate. In order to achieve this, the existing natural language processing tools were studied and, after this study, some adaptations were made in order to try to obtain better results for the Portuguese language. The previously mentioned work continues with the integration of tools that allow you to extract information and culminates with a demonstration of its application to the generation of pairs of questions and answers, which may be useful to applications such as conversational agents and chatbots. In this work a new Natural Language Processing pipeline for the Portuguese language was assembled, using the Python programming language.eng
dc.language.isopor-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/-
dc.subjectInteligência Artificialpor
dc.subjectProcessamento de Linguagem Naturalpor
dc.subjectReconhecimento de Entidades Mencionadaspor
dc.subjectExtracção de Informaçãopor
dc.subjectGeração de Questõespor
dc.subjectArtificial Intelligenceeng
dc.subjectNatural Language Processingeng
dc.subjectNamed Entity Recognitioneng
dc.subjectInformation Extractioneng
dc.subjectQuestion Generationeng
dc.titlePython para Pré-processamento e Extracção de Características a partir de Texto Portuguêspor
dc.title.alternativePython for Pre-processment and Feature Extraction from Portuguese Texteng
dc.typemasterThesis-
degois.publication.locationDEI-FCTUC-
degois.publication.titlePython para Pré-processamento e Extracção de Características a partir de Texto Portuguêspor
dc.peerreviewedyes-
dc.identifier.tid202307085-
thesis.degree.disciplineInformática-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado em Engenharia Informática-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Engenharia Informática-
uc.degree.grantorID0500-
uc.contributor.authorFerreira, João Diogo Coelho::0000-0003-0203-8443-
uc.degree.classification17-
uc.degree.presidentejuriCurado, Marília Pascoal-
uc.degree.elementojuriOliveira, Hugo Ricardo Gonçalo-
uc.degree.elementojuriArrais, Joel Perdiz-
uc.contributor.advisorOliveira, Hugo Ricardo Gonçalo-
item.grantfulltextopen-
item.cerifentitytypePublications-
item.languageiso639-1pt-
item.openairetypemasterThesis-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.fulltextCom Texto completo-
crisitem.advisor.researchunitCISUC - Centre for Informatics and Systems of the University of Coimbra-
crisitem.advisor.parentresearchunitFaculty of Sciences and Technology-
crisitem.advisor.orcid0000-0002-5779-8645-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat
Tese_Final_Joao_Ferreira.pdf2.19 MBAdobe PDFView/Open
Show simple item record

Page view(s)

438
checked on May 7, 2024

Download(s) 50

1,932
checked on May 7, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons