Text this: Procesamiento de videos para la extracción de segmentos de tiempo y asignación para audio descripción