Geração de Pseudopalavras para Avaliação Linguística

Venâncio, Rui Pedro de Azevedo

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/86630

Title:	Geração de Pseudopalavras para Avaliação Linguística
Other Titles:	Pseudo-word Generator for Linguistic Evaluation
Authors:	Venâncio, Rui Pedro de Azevedo
Orientador:	Perdigão, Fernando Manuel dos Santos
Keywords:	Pseudopalavras; Base de dados; Gerador de pseudopalavras; Sílabas; Português Europeu; Pseudowords; Database; Pseudowords generator; Syllables; European Portuguese
Issue Date:	28-Feb-2018
Serial title, monograph or event:	Geração de Pseudopalavras para Avaliação Linguística
Place of publication or event:	DEEC
Abstract:	A capacidade de leitura é um aspeto importante durante a aprendizagem da língua e é adquirida, geralmente, em crianças com idade escolar. A avaliação do desempenho da leitura pode ser aferida através de diferentes formas, tanto na leitura de palavras como na leitura de pseudopalavras. Pseudopalavras são palavras que não existem no léxico, mas que são pronunciáveis, uma vez que seguem as regras fonotáticas de uma determinada língua. A leitura de pseudopalavras permite avaliar se as regras de conversão de texto para fala (consciência fonológica) estão bem assimiladas, já que o leitor não tem familiaridade com as pseudopalavras que está a ler. Assim é possível avaliar o desempenho na leitura, de modo a, por exemplo, prevenir futuros défices fonológicos. Assim, é importante a criação de um sistema que seja capaz de gerar pseudopalavras, segundo determinados critérios e especificações da língua, porque até ao momento não existe nenhum gerador de pseudopalavras, em Portuguêss Europeu. Este trabalho aborda o problema da geração de pseudopalavras, propondo algoritmos para a sua concretização. Os algoritmos são baseados em concatenação de sílabas, com a garantia de que todos os pares de sílabas, que formarão as pseudopalavras, são encontros silábicos encontrados no léxico. A frequência de ocorrência desses pares de sílabas, como ínicio, meio e fim de palavra, será crucial para a formação de pseudopalavras, pois os pares de sílabas tenderão a aparecer com mais frequência, consoante o seu número de ocorrência nas diferentes posições das pseudopalavras. Este projeto também pressupõe a criação de um corpus lexical e um software fácil de utilizar e capaz de mostrar as pseudopalavras geradas e medidas adicionais, relacionadas com proximidade lexical. Os algoritmos e o consequente interface com o utilizador foram desenvolvidos em MATLAB. Reading ability plays an important role during the process of learning any language and is acquired in children, generally, in elementary school. The evaluation of reading performance can be done by reading words or pseudowords.Pseudowords are words that respect the phonotactic restrictions of a language and can be read, but don’t exist in lexicon.When reading pseudowords it’s possible to evaluate if the rules of conversion from text to speech (phonological awareness) are well assimilated, since the reader doesn’t have any kind of familiarity with it. Thus it is possible to evaluate the reading performance in order to, for example, prevent future phonological deficits. So it is important to have a system that can be able to generate pseudowords, according to certain criteria and specifications, because there is none generator, in European Portuguese, at the moment.This thesis describes the process of generating pseudowords and proposes algorithms for this task. The algorithms are based on concatenation of syllables, with the condition that all pairs of syllables, that will form the pseudowords, were found in the lexicon. The frequency of occurrence of the pairs of syllables, in the beginning, middle and end of words from lexicon, will have an important role in the formation of pseudowords. It means that more frequent pairs of syllables will tend to appear, more frequently, in the different positions of the pseudowords. This project also presupposes the creation of a lexical corpora and an easy-to-use software capable of showing in a table the generated pseudowords and other metrics related to lexical proximity. The algorithms and the user interface were developed in MATLAB.
Description:	Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia
URI:	https://hdl.handle.net/10316/86630
Rights:	openAccess
Appears in Collections:	UC - Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
Venancio.pdf		1.29 MB	Adobe PDF	View/Open

Show full item record

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Google ScholarTM

Google Scholar^TM