Analysis and Development of an End-to-End Convolutional Neural Network for Sounds Classification Through Deep Learning Techniques

Galindo-Meza, Carlos A.

Analysis and Development of an End-to-End Convolutional Neural Network for Sounds Classification Through Deep Learning Techniques

dc.contributor.advisor	López-Meyer, Paulo
dc.contributor.author	Galindo-Meza, Carlos A.
dc.date.accessioned	2022-06-01T18:49:50Z
dc.date.available	2022-06-01T18:49:50Z
dc.date.issued	2021-11
dc.description	El presente trabajo estudia el análisis y desarrollo continuo de un modelo de inteligencia artificial orientado a la clasificación de audio. El capítulo 1 presenta antecedentes sobre las diferentes tareas relacionadas a audio que la comunidad de investigación ha seguido a lo largo de los últimos años, también establece la hipótesis central de este trabajo y define objetivos generales y específicos para contribuir a la mejora del rendimiento sobre un generador de embeddings de audio de tipo end-to-end. El capítulo 2 presenta los métodos de vanguardia y trabajos publicados que se enfocan principalmente al desarrollo de la clasificación de audio y el aprendizaje profundo como disciplinas que aún tienen un gran potencial. El capítulo 3 presenta el marco conceptual en el que se basa esta tesis, dividido en dos secciones principales: preprocesamiento de audio y técnicas de aprendizaje profundo. Cada una de estas secciones se divide en varias subsecciones para representar el proceso de clasificación de audio a través de redes neuronales profundas. El capítulo 4 brinda una explicación profunda del generador de embeddings de audio llamado AemNet y sus componentes, utilizado como objeto de estudio, donde se detalla en las siguientes subsecciones. Se realizó una experimentación inicial sobre este enfoque y se presentaron resultados experimentales que sugirieron un mejor rendimiento mediante la modificación de las etapas de arquitectura de la red neuronal. El capítulo 5 es la primera aplicación objetivo de nuestra adaptación de AemNet que se presentó al desafío DCASE 2021. Los detalles sobre el desafío y los resultados se describen en las secciones de este capítulo, así como la metodología seguida para presentar nuestra propuesta. El capítulo 6 es la segunda aplicación objetivo y el primero en apuntar a los sonidos respiratorios. El desafío de ICBHI se explica en las secciones de este capítulo, así como la metodología y los experimentos realizados para llegar a un clasificador robusto que distingue cuatro anomalías de tos diferentes. Se creó un artículo a partir de la solución propuesta y se presentó en el IEEE LA-CCI 2021. El capítulo 7 aprovecha los diversos resultados anteriores para cumplir con un enfoque moderno como lo es la detección de COVID-19, cuya recopilación y experimentación de fuentes de datos se describen profundamente y los resultados experimentales sugieren que una adaptación de red residual denominada AemResNet, puede cumplir la función de distinguir a los pacientes con COVID-19 a partir de tos y sonidos respiratorios. Finalmente, las conclusiones de toda esta investigación y los resultados evaluados en cada una de las aplicaciones objetivo se discuten en el capítulo 8.	es_MX
dc.description.sponsorship	ITESO, A. C.	es
dc.identifier.citation	Galindo-Meza, C. A. (2021). Analysis and Development of an End-to-End Convolutional Neural Network for Sounds Classification Through Deep Learning Techniques. Trabajo de obtención de grado, Maestría en Sistemas Computacionales. Tlaquepaque, Jalisco: ITESO.	es_MX
dc.identifier.uri	https://hdl.handle.net/11117/8047
dc.language.iso	eng	es_MX
dc.publisher	ITESO	es_MX
dc.rights.uri	http://quijote.biblio.iteso.mx/licencias/CC-BY-NC-2.5-MX.pdf	es_MX
dc.subject	Inteligencia Artificial	es_MX
dc.subject	Redes Neuronales	es_MX
dc.subject	COVID-19	es_MX
dc.subject	Clasificación	es_MX
dc.subject	Sonido	es_MX
dc.title	Analysis and Development of an End-to-End Convolutional Neural Network for Sounds Classification Through Deep Learning Techniques	es_MX
dc.type	info:eu-repo/semantics/masterThesis	es_MX
dc.type.version	info:eu-repo/semantics/acceptedVersion	es_MX

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: CarlosGalindo-MSC-TOG.pdf
Tamaño:: 2.38 MB
Formato:: Adobe Portable Document Format
Descripción:

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 5.03 KB
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

DESI - Trabajos de fin de Maestría en Sistemas Computacionales