Detección y clasificación de palabras a partir de la lectura de labios mediante técnicas de aprendizaje profundo y aprendizaje máquina

dc.contributor.advisorMartínez-Sánchez, Víctor H.
dc.contributor.advisorVillalón-Turrubiates, Iván E.
dc.contributor.authorMontes-Díaz, Edgar E.
dc.date.accessioned2024-08-07T19:51:35Z
dc.date.available2024-08-07T19:51:35Z
dc.date.issued2024-07
dc.description.abstractLa información contenida en los labios y el rostro proporciona datos significativos para el reconocimiento del habla y el procesamiento del lenguaje natural. Aunque existen diversas metodologías para abordar este problema, la mayoría se basan en conjuntos de datos en chino e inglés. Este trabajo se enfoca en la implementación de un modelo alimentado por un conjunto de datos en español, desarrollado específicamente para este proyecto. El objetivo es generar una herramienta útil capaz de clasificar palabras en español latino, sirviendo como referencia para futuras investigaciones orientadas a la creación de subtítulos automáticos para personas con discapacidad auditiva. Utilizando técnicas de Aprendizaje Máquina, por sus siglas en inglés (ML) y Aprendizaje Profundo, por sus siglas en inglés (DL), se busca extraer características clave para la Lectura Automática de Labios, por sus siglas en inglés (ALR), a partir de videos. El modelo se alimenta de un conjunto de datos propio. Este conjunto de datos está diseñado para incorporar técnicas de extracción de características utilizando Redes Neuronales Convolucionales, por sus siglas en inglés (CNN) y memoria a corto plazo. Se pretende utilizar un modelo recurrente como las Redes Neuronales de Memoria de Corto-Largo Plazo, por sus siglas en inglés (LSTM). La arquitectura del modelo permitirá utilizar la información temporal en videos, donde eventos anteriores ayudarán a mejorar la predicción futura de palabras. De esta manera, se ofrece una solución avanzada y accesible para el reconocimiento del habla en español latino.
dc.description.sponsorshipITESO, A. C.es
dc.identifier.citationMontes-Díaz, E. E. (2024). Detección y clasificación de palabras a partir de la lectura de labios mediante técnicas de aprendizaje profundo y aprendizaje máquina. Trabajo de obtención de grado, Maestría en Sistemas Computacionales. Tlaquepaque, Jalisco: ITESO.
dc.identifier.urihttps://hdl.handle.net/11117/11033
dc.language.isospa
dc.publisherITESO
dc.rights.urihttps://creativecommons.org/licenses/by-nc/4.0/deed.es
dc.subjectLectura Automática De Labios
dc.subjectDiscapacidad Auditiva
dc.subjectAprendizaje Máquina
dc.subjectAprendizaje Profundo
dc.subjectVisión Computacional
dc.subjectLSTM
dc.subjectRNN
dc.subjectCNN
dc.titleDetección y clasificación de palabras a partir de la lectura de labios mediante técnicas de aprendizaje profundo y aprendizaje máquina
dc.title.alternativeDetection and Classification of Words From Lip Reading Using Deep Learning and Machine Learning Techniques
dc.typeinfo:eu-repo/semantics/masterThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
TOG_clasificacion_de_palabras_a_partir_de_ALR.pdf
Tamaño:
2.8 MB
Formato:
Adobe Portable Document Format