Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
Metadatos:
Mostrar el registro completo del ítemAutor/es:
González, Joaquín
Tutor/es:
Gattei, Carolina A.
Gravano, Agustín
Carrera de la tesis:
Master in Management + Analytics
Fecha:
2023Resumen
El presente trabajo se enmarca en el proyecto de investigación de la Dra. Carolina Gattei y la Mag. Analí Taboh, radicado en la Universidad Torcuato Di Tella, en el cual se realizan pruebas que ayudan a diagnosticar a personas con distintas patologías del habla y la audición. Los datos recolectados por el equipo son entrevistas a niños/as con hipoacusia y equipados con audífono(s) y/o implante coclear. La transcripción y análisis de estas pruebas es un proceso manual y costoso en términos de tiempo y recursos. Actualmente, el estado del arte de los principales modelos de reconocimiento automático del habla (ASR por sus siglas en inglés) son entrenados para trabajar en lenguas de amplio alcance (como el español o el inglés) y para personas sin dificultades en el habla. Sin embargo, cuando se trata de hablantes con patologías del habla y la audición, como parte de los resultados de este trabajo se ha corroborado que estos modelos tienen una baja tasa de aciertos dada la escasa, o nula, representación ´on que tiene esta población en los datos de entrenamiento. En el presente trabajo se argumenta que, haciendo uso de técnicas de aprendizaje automático y transferencia de conocimiento, puede sacarse provecho de modelos de ASR pre entrenados para lograr adaptarlos a una población con modelos acústicos poco representados actualmente. El objetivo general de esta tesis es explorar la factibilidad de implementar una metodología que permita la construcción y evaluación de sistemas de procesamiento automático del habla que generen transcripciones enriquecidas sobre los audios producidos por los/as niños/as con dificultades del habla y la audición. Esto requiere de ensamblar distintos modelos especializados en tareas de reconocimiento de voz y elaborar un mecanismo que permita evaluar y comparar estos sistemas.