Reconhecedor de fonemas em português europeu baseado em redes neuronais

Franco, Guilherme de Abreu

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/81609

Title:	Reconhecedor de fonemas em português europeu baseado em redes neuronais
Other Titles:	European portuguese phoneme recognizer based on neural networks
Authors:	Franco, Guilherme de Abreu
Orientador:	Perdigão, Fernando Manuel dos Santos Fernandes, Gabriel Falcão Paiva
Keywords:	DNN; Reconhecimento de Fonemas; CNTK; GPU; HMM; DNN; Phoneme recognition; CNTK; GPU; HMM
Issue Date:	20-Sep-2016
Serial title, monograph or event:	Reconhecedor de fonemas em português europeu baseado em redes neuronais
Place of publication or event:	DEEC
Abstract:	Nesta tese aborda-se o problema de reconhecimento automático de fonemas em português europeu através do uso de redes neuronais profundas (DNNs – Deep Neural Networks) em conjugação com modelos de Markov não observáveis (HMM). Implementam-se soluções para esse mesmo problema, explorando diversas arquitecturas para as DNNs usando vários tipos de parâmetros.Começa-se com a implementação de reconhecedores simples, em que as redes neuronais têm apenas uma ou duas camadas escondidas.Posteriormente implementa-se um sistema que usa três contextos temporais (esquerdo, central e direito), baseado no reconhecedor desenvolvido pela Universidade de Brno.São ainda feitas tentativas de melhoria do desempenho das redes implementadas.O desenvolvimento desses sistemas é feito usando o framework CNTK, criado pela Microsoft, que possibilita o treino de forma eficiente dos sistemas em placas gráficas (ou GPUs – Graphics Processing Units).O sistema de GPUs usado é disponibilizado pelo centro de pesquisa CUDA da NVidia, localizado no laboratório de processamento de imagem do Instituto de Telecomunicações da Universidade de Coimbra.Palavras-Chave : DNN, Reconhecimento de Fonemas, CNTK, GPU,HMM . In this thesis, the problem of automatic European Portuguese phoneme recognition using deep neural networks (DNNs) in conjunction with hidden Markov models (HMMs) is tackled. Solutions to that same problem are implemented, exploring several DNN architectures while using several kinds of parameters.A simple recognizer is implemented at first, in which the DNNs have only one or two hidden layers.Then, a system with three contexts is implemented (left, central and right), based on the recognizer developed by Brno University. Attempts are made in order to improve the performance of the implemented networks.The networks development is achieved through the use of Microsoft’s CNTK framework, which makes training using graphics processing units (GPUs) possible.The used GPU system is provided by NVidia’s CUDA research center located at the image processing laboratory, at University of Coimbra’s Telecommunications Institute. Key-Words : DNN, Phoneme recognition, CNTK, GPU, HMM .
Description:	Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia
URI:	https://hdl.handle.net/10316/81609
Rights:	openAccess
Appears in Collections:	UC - Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
Tese_V3.pdf		3.72 MB	Adobe PDF	View/Open

Show full item record

Page view(s) 50

474

checked on Apr 23, 2024

Download(s) 50

462

checked on Apr 23, 2024

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Page view(s) 50

Download(s) 50

Google ScholarTM

Google Scholar^TM