Please use this identifier to cite or link to this item:
https://hdl.handle.net/10316/81609
Title: | Reconhecedor de fonemas em português europeu baseado em redes neuronais | Other Titles: | European portuguese phoneme recognizer based on neural networks | Authors: | Franco, Guilherme de Abreu | Orientador: | Perdigão, Fernando Manuel dos Santos Fernandes, Gabriel Falcão Paiva |
Keywords: | DNN; Reconhecimento de Fonemas; CNTK; GPU; HMM; DNN; Phoneme recognition; CNTK; GPU; HMM | Issue Date: | 20-Sep-2016 | metadata.degois.publication.title: | Reconhecedor de fonemas em português europeu baseado em redes neuronais | metadata.degois.publication.location: | DEEC | Abstract: | Nesta tese aborda-se o problema de reconhecimento automático de fonemas em português europeu através do uso de redes neuronais profundas (DNNs – Deep Neural Networks) em conjugação com modelos de Markov não observáveis (HMM). Implementam-se soluções para esse mesmo problema, explorando diversas arquitecturas para as DNNs usando vários tipos de parâmetros.Começa-se com a implementação de reconhecedores simples, em que as redes neuronais têm apenas uma ou duas camadas escondidas.Posteriormente implementa-se um sistema que usa três contextos temporais (esquerdo, central e direito), baseado no reconhecedor desenvolvido pela Universidade de Brno.São ainda feitas tentativas de melhoria do desempenho das redes implementadas.O desenvolvimento desses sistemas é feito usando o framework CNTK, criado pela Microsoft, que possibilita o treino de forma eficiente dos sistemas em placas gráficas (ou GPUs – Graphics Processing Units).O sistema de GPUs usado é disponibilizado pelo centro de pesquisa CUDA da NVidia, localizado no laboratório de processamento de imagem do Instituto de Telecomunicações da Universidade de Coimbra.Palavras-Chave : DNN, Reconhecimento de Fonemas, CNTK, GPU,HMM . In this thesis, the problem of automatic European Portuguese phoneme recognition using deep neural networks (DNNs) in conjunction with hidden Markov models (HMMs) is tackled. Solutions to that same problem are implemented, exploring several DNN architectures while using several kinds of parameters.A simple recognizer is implemented at first, in which the DNNs have only one or two hidden layers.Then, a system with three contexts is implemented (left, central and right), based on the recognizer developed by Brno University. Attempts are made in order to improve the performance of the implemented networks.The networks development is achieved through the use of Microsoft’s CNTK framework, which makes training using graphics processing units (GPUs) possible.The used GPU system is provided by NVidia’s CUDA research center located at the image processing laboratory, at University of Coimbra’s Telecommunications Institute. Key-Words : DNN, Phoneme recognition, CNTK, GPU, HMM . |
Description: | Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia | URI: | https://hdl.handle.net/10316/81609 | Rights: | openAccess |
Appears in Collections: | UC - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Tese_V3.pdf | 3.72 MB | Adobe PDF | View/Open |
Page view(s) 50
524
checked on Oct 29, 2024
Download(s) 50
474
checked on Oct 29, 2024
Google ScholarTM
Check
This item is licensed under a Creative Commons License