Sistema de identificación de locutor texto dependiente en Raspberry PI 3 B con aplicación en control de acceso.

En este proyecto se desarrolla un sistema de reconocimiento de locutor texto dependiente con base a los coeficientes cepstrales de la voz utilizando una Raspberry Pi 3 B, en conjunto con una tarjeta de audio USB y un micrófono con conexión tipo jack de 3.5mm. En este dispositivo embebido se implemen...

Full description

Autores:
Blanco Ortiz, Raul Alejandro
Garzón Gamez, Nelson Javier
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2019
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/22365
Acceso en línea:
http://hdl.handle.net/11349/22365
Palabra clave:
Reconocimiento de locutor
Parámetros cepstrales
Raspberry
Base de datos
Ingeniería en Control - Tesis y disertaciones académicas
Raspberry Pi 3
Estandarización - Manuales
Mejoramiento de procesos
Speaker recognition
Cepstral parameters
Raspberry
Database
Rights
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
Description
Summary:En este proyecto se desarrolla un sistema de reconocimiento de locutor texto dependiente con base a los coeficientes cepstrales de la voz utilizando una Raspberry Pi 3 B, en conjunto con una tarjeta de audio USB y un micrófono con conexión tipo jack de 3.5mm. En este dispositivo embebido se implementa la captura de la señal de audio, el acondicionamiento de la señal, la extracción de las características de la voz, la técnica de reconocimiento de locutor, el manejo de la base de datos para cada los usuarios del sistema, el registro de acceso de los usuarios y la implementación de la interfaz. Todo el desarrollo del sistema se realiza en software libre utilizando el lenguaje de programación Python en la versión 3.5, utilizando la librería pyaudio para la captura de la señal, librerías matemáticas como numpy, scipy, wave para el acondicionamiento de la señal, para la extracción de los parámetros cepstrales de la voz se utiliza la librería speech_features, la técnica de reconocimiento implementada es DTW y la base de datos del sistema es implementada en MySQL. Al final, se realizan pruebas para identificar falsas aceptaciones y falsos rechazos y así, determinar el porcentaje de error del sistema, su confiabilidad y eficiencia.