Analysis and Development of an End-to-End Convolutional Neural Network for Sounds Classification Through Deep Learning Techniques
dc.contributor.advisor | López-Meyer, Paulo | |
dc.contributor.author | Galindo-Meza, Carlos A. | |
dc.date.accessioned | 2022-06-01T18:49:50Z | |
dc.date.available | 2022-06-01T18:49:50Z | |
dc.date.issued | 2021-11 | |
dc.description | El presente trabajo estudia el análisis y desarrollo continuo de un modelo de inteligencia artificial orientado a la clasificación de audio. El capítulo 1 presenta antecedentes sobre las diferentes tareas relacionadas a audio que la comunidad de investigación ha seguido a lo largo de los últimos años, también establece la hipótesis central de este trabajo y define objetivos generales y específicos para contribuir a la mejora del rendimiento sobre un generador de embeddings de audio de tipo end-to-end. El capítulo 2 presenta los métodos de vanguardia y trabajos publicados que se enfocan principalmente al desarrollo de la clasificación de audio y el aprendizaje profundo como disciplinas que aún tienen un gran potencial. El capítulo 3 presenta el marco conceptual en el que se basa esta tesis, dividido en dos secciones principales: preprocesamiento de audio y técnicas de aprendizaje profundo. Cada una de estas secciones se divide en varias subsecciones para representar el proceso de clasificación de audio a través de redes neuronales profundas. El capítulo 4 brinda una explicación profunda del generador de embeddings de audio llamado AemNet y sus componentes, utilizado como objeto de estudio, donde se detalla en las siguientes subsecciones. Se realizó una experimentación inicial sobre este enfoque y se presentaron resultados experimentales que sugirieron un mejor rendimiento mediante la modificación de las etapas de arquitectura de la red neuronal. El capítulo 5 es la primera aplicación objetivo de nuestra adaptación de AemNet que se presentó al desafío DCASE 2021. Los detalles sobre el desafío y los resultados se describen en las secciones de este capítulo, así como la metodología seguida para presentar nuestra propuesta. El capítulo 6 es la segunda aplicación objetivo y el primero en apuntar a los sonidos respiratorios. El desafío de ICBHI se explica en las secciones de este capítulo, así como la metodología y los experimentos realizados para llegar a un clasificador robusto que distingue cuatro anomalías de tos diferentes. Se creó un artículo a partir de la solución propuesta y se presentó en el IEEE LA-CCI 2021. El capítulo 7 aprovecha los diversos resultados anteriores para cumplir con un enfoque moderno como lo es la detección de COVID-19, cuya recopilación y experimentación de fuentes de datos se describen profundamente y los resultados experimentales sugieren que una adaptación de red residual denominada AemResNet, puede cumplir la función de distinguir a los pacientes con COVID-19 a partir de tos y sonidos respiratorios. Finalmente, las conclusiones de toda esta investigación y los resultados evaluados en cada una de las aplicaciones objetivo se discuten en el capítulo 8. | es_MX |
dc.description.sponsorship | ITESO, A. C. | es |
dc.identifier.citation | Galindo-Meza, C. A. (2021). Analysis and Development of an End-to-End Convolutional Neural Network for Sounds Classification Through Deep Learning Techniques. Trabajo de obtención de grado, Maestría en Sistemas Computacionales. Tlaquepaque, Jalisco: ITESO. | es_MX |
dc.identifier.uri | https://hdl.handle.net/11117/8047 | |
dc.language.iso | eng | es_MX |
dc.publisher | ITESO | es_MX |
dc.rights.uri | http://quijote.biblio.iteso.mx/licencias/CC-BY-NC-2.5-MX.pdf | es_MX |
dc.subject | Inteligencia Artificial | es_MX |
dc.subject | Redes Neuronales | es_MX |
dc.subject | COVID-19 | es_MX |
dc.subject | Clasificación | es_MX |
dc.subject | Sonido | es_MX |
dc.title | Analysis and Development of an End-to-End Convolutional Neural Network for Sounds Classification Through Deep Learning Techniques | es_MX |
dc.type | info:eu-repo/semantics/masterThesis | es_MX |
dc.type.version | info:eu-repo/semantics/acceptedVersion | es_MX |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- CarlosGalindo-MSC-TOG.pdf
- Tamaño:
- 2.38 MB
- Formato:
- Adobe Portable Document Format
- Descripción: