Sistema de identificación de locutor texto dependiente en Raspberry PI 3 B con aplicación en control de acceso.
En este proyecto se desarrolla un sistema de reconocimiento de locutor texto dependiente con base a los coeficientes cepstrales de la voz utilizando una Raspberry Pi 3 B, en conjunto con una tarjeta de audio USB y un micrófono con conexión tipo jack de 3.5mm. En este dispositivo embebido se implemen...
- Autores:
-
Blanco Ortiz, Raul Alejandro
Garzón Gamez, Nelson Javier
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2019
- Institución:
- Universidad Distrital Francisco José de Caldas
- Repositorio:
- RIUD: repositorio U. Distrital
- Idioma:
- spa
- OAI Identifier:
- oai:repository.udistrital.edu.co:11349/22365
- Acceso en línea:
- http://hdl.handle.net/11349/22365
- Palabra clave:
- Reconocimiento de locutor
Parámetros cepstrales
Raspberry
Base de datos
Ingeniería en Control - Tesis y disertaciones académicas
Raspberry Pi 3
Estandarización - Manuales
Mejoramiento de procesos
Speaker recognition
Cepstral parameters
Raspberry
Database
- Rights
- License
- Atribución-NoComercial-SinDerivadas 4.0 Internacional
Summary: | En este proyecto se desarrolla un sistema de reconocimiento de locutor texto dependiente con base a los coeficientes cepstrales de la voz utilizando una Raspberry Pi 3 B, en conjunto con una tarjeta de audio USB y un micrófono con conexión tipo jack de 3.5mm. En este dispositivo embebido se implementa la captura de la señal de audio, el acondicionamiento de la señal, la extracción de las características de la voz, la técnica de reconocimiento de locutor, el manejo de la base de datos para cada los usuarios del sistema, el registro de acceso de los usuarios y la implementación de la interfaz. Todo el desarrollo del sistema se realiza en software libre utilizando el lenguaje de programación Python en la versión 3.5, utilizando la librería pyaudio para la captura de la señal, librerías matemáticas como numpy, scipy, wave para el acondicionamiento de la señal, para la extracción de los parámetros cepstrales de la voz se utiliza la librería speech_features, la técnica de reconocimiento implementada es DTW y la base de datos del sistema es implementada en MySQL. Al final, se realizan pruebas para identificar falsas aceptaciones y falsos rechazos y así, determinar el porcentaje de error del sistema, su confiabilidad y eficiencia. |
---|