Geração de Pseudopalavras para Avaliação Linguística

Venâncio, Rui Pedro de Azevedo

Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/86630

Título:	Geração de Pseudopalavras para Avaliação Linguística
Outros títulos:	Pseudo-word Generator for Linguistic Evaluation
Autor:	Venâncio, Rui Pedro de Azevedo
Orientador:	Perdigão, Fernando Manuel dos Santos
Palavras-chave:	Pseudopalavras; Base de dados; Gerador de pseudopalavras; Sílabas; Português Europeu; Pseudowords; Database; Pseudowords generator; Syllables; European Portuguese
Data:	28-Fev-2018
Título da revista, periódico, livro ou evento:	Geração de Pseudopalavras para Avaliação Linguística
Local de edição ou do evento:	DEEC
Resumo:	A capacidade de leitura é um aspeto importante durante a aprendizagem da língua e é adquirida, geralmente, em crianças com idade escolar. A avaliação do desempenho da leitura pode ser aferida através de diferentes formas, tanto na leitura de palavras como na leitura de pseudopalavras. Pseudopalavras são palavras que não existem no léxico, mas que são pronunciáveis, uma vez que seguem as regras fonotáticas de uma determinada língua. A leitura de pseudopalavras permite avaliar se as regras de conversão de texto para fala (consciência fonológica) estão bem assimiladas, já que o leitor não tem familiaridade com as pseudopalavras que está a ler. Assim é possível avaliar o desempenho na leitura, de modo a, por exemplo, prevenir futuros défices fonológicos. Assim, é importante a criação de um sistema que seja capaz de gerar pseudopalavras, segundo determinados critérios e especificações da língua, porque até ao momento não existe nenhum gerador de pseudopalavras, em Portuguêss Europeu. Este trabalho aborda o problema da geração de pseudopalavras, propondo algoritmos para a sua concretização. Os algoritmos são baseados em concatenação de sílabas, com a garantia de que todos os pares de sílabas, que formarão as pseudopalavras, são encontros silábicos encontrados no léxico. A frequência de ocorrência desses pares de sílabas, como ínicio, meio e fim de palavra, será crucial para a formação de pseudopalavras, pois os pares de sílabas tenderão a aparecer com mais frequência, consoante o seu número de ocorrência nas diferentes posições das pseudopalavras. Este projeto também pressupõe a criação de um corpus lexical e um software fácil de utilizar e capaz de mostrar as pseudopalavras geradas e medidas adicionais, relacionadas com proximidade lexical. Os algoritmos e o consequente interface com o utilizador foram desenvolvidos em MATLAB. Reading ability plays an important role during the process of learning any language and is acquired in children, generally, in elementary school. The evaluation of reading performance can be done by reading words or pseudowords.Pseudowords are words that respect the phonotactic restrictions of a language and can be read, but don’t exist in lexicon.When reading pseudowords it’s possible to evaluate if the rules of conversion from text to speech (phonological awareness) are well assimilated, since the reader doesn’t have any kind of familiarity with it. Thus it is possible to evaluate the reading performance in order to, for example, prevent future phonological deficits. So it is important to have a system that can be able to generate pseudowords, according to certain criteria and specifications, because there is none generator, in European Portuguese, at the moment.This thesis describes the process of generating pseudowords and proposes algorithms for this task. The algorithms are based on concatenation of syllables, with the condition that all pairs of syllables, that will form the pseudowords, were found in the lexicon. The frequency of occurrence of the pairs of syllables, in the beginning, middle and end of words from lexicon, will have an important role in the formation of pseudowords. It means that more frequent pairs of syllables will tend to appear, more frequently, in the different positions of the pseudowords. This project also presupposes the creation of a lexical corpora and an easy-to-use software capable of showing in a table the generated pseudowords and other metrics related to lexical proximity. The algorithms and the user interface were developed in MATLAB.
Descrição:	Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia
URI:	https://hdl.handle.net/10316/86630
Direitos:	openAccess
Aparece nas coleções:	UC - Dissertações de Mestrado

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
Venancio.pdf		1.29 MB	Adobe PDF	Ver/Abrir

Mostrar registo em formato completo

Visualizações de página 20

757

Visto em 16/abr/2024

Downloads 50

1.547

Visto em 16/abr/2024

Google Scholar^TM

Verificar

Este registo está protegido por Licença Creative Commons

Ficheiros deste registo:

Visualizações de página 20

Downloads 50

Google ScholarTM

Google Scholar^TM