Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/40540
Título: Sistema de Reconhecimento de Fala via Web
Autor: Cardoso, Joao Daniel da Silva 
Orientador: Perdigão, Fernando Manuel dos Santos
Palavras-chave: Reconhecimento de fala; Julius Speech Recognizer; Web API; Node.js; Speech Recognition; Julius Speech Recognizer; Web API; Node.js
Data: 23-Fev-2016
Local de edição ou do evento: Coimbra
Resumo: Com a especificação do HTML5 deu-se uma revolução das tecnologias web. A criação de novas APIs tem vindo a substituir, progressivamente, a utilização de plugins. Assim, a web development passou a estar em código aberto para a comunidade. O reconhecimento de fala também passa a estar disponível segundo as novas especificações do HTML5. Esta dissertação contribui com um sistema de reconhecimento de fala alternativo ao dos fabricantes de browsers. O objetivo desta dissertação consiste na implementação de um demonstrador de reconhecimento de fala, através da web. O reconhecedor está integrado num servidor e este gere os acessos dos clientes, feitos através de páginas HTML. Para que tal aconteça, o cliente deverá enviar o áudio juntamente com a lista de possíveis palavras a reconhecer. O microfone é acedido através da MediaStream API, sendo analisado pela WebAudio API. Cada segmento de áudio gerado é enviado para o servidor, via streaming. Este utiliza a tecnologia Node.js, que por sua vez utiliza a arquitetura event driven, na gestão de pedidos. O motor de reconhecimento de fala usado é o Julius, um software de domínio público. Os modelos acústicos, sistema de transcrição de letras para fonemas e dicionário fonético foram desenvolvidos previamente no laboratório onde ocorreu esta dissertação. O sistema permite satisfazer pedidos de reconhecimento em simultâneo e oriundos de qualquer sítio da internet. Também é compatível com os principais browsers de internet. Para isso, basta que as páginas HTML sigam um protocolo simples de indicação de objetos que podem ter uma entrada por fala, além dos habituais dispositivos de entrada, rato e teclado.
Descrição: Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra
URI: https://hdl.handle.net/10316/40540
Direitos: openAccess
Aparece nas coleções:UC - Dissertações de Mestrado
FCTUC Eng.Electrotécnica - Teses de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato
Sistema de Reconhecimento de Fala via Web.pdf1.69 MBAdobe PDFVer/Abrir
Mostrar registo em formato completo

Visualizações de página 50

567
Visto em 23/abr/2024

Downloads 20

1.527
Visto em 23/abr/2024

Google ScholarTM

Verificar


Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.