Procesamiento de audio digital para la clasificación de sonidos urbanos a través de una red neuronal

dc.contributor.advisorBecerra-López, Fernando I.
dc.contributor.authorLópez-Escudero, Ramón
dc.date.accessioned2023-05-15T19:46:19Z
dc.date.available2023-05-15T19:46:19Z
dc.date.issued2023-05
dc.descriptionEn respuesta directa al crecimiento poblacional en las grandes urbes, las ciudades inteligentes se han impulsado como un catalizador tecnológico, el cual permite aprovechar la disponibilidad de arquitecturas sensoriales distribuidas a lo largo de la urbe. Esto promueve nuevas áreas de estudio, siendo una de ellas la clasificación de sonidos ambientales (ESC, por sus siglas en inglés). Múltiples esfuerzos se han desarrollado para generar algoritmos computacionales que infieran de manera adecuada la relación entre los sonidos urbanos y su taxonomía, área poco profundizada en comparación a otras ramas de investigación. Sin embargo la técnica óptima para resolver este tipo de problemas no ha sido identificada aún, por lo que existen áreas de oportunidad en este campo de investigación como lo son la selección del método adecuado para trasladar el sonido a una representación numérica, prepreocesamiento del audio digital, selección del modelo predictivo a implementar, entre otras. La investigación presentada en esta tesis ahonda diferentes tópicos, abordando desde el procesamiento de señales para trasladar el espacio auditivo a una representación numérica a través de los coeficientes cepstrales de Mel (MFCCs, por sus siglas en inglés), hasta la selección y ajuste de un modelo de inteligencia artificial que tiene como foco principal un método de clasificación robusto para inferir la taxonomía de los sonidos contenidos en una urbe. Esta investigación se realizó utilizando el conjunto de datos”UrbanSound8k”, el cual integra diez categorías de sonidos (motores de autos, ruido a consecuencia de obras civiles, etcétera), además de ser punto de referencia en diversas investigaciones.es_MX
dc.identifier.citationLópez-Escudero, R. (2023). Procesamiento de audio digital para la clasificación de sonidos urbanos a través de una red neuronal. Trabajo de obtención de grado, Maestría en Ciencia de Datos. Tlaquepaque, Jalisco: ITESO.es_MX
dc.identifier.urihttps://hdl.handle.net/11117/9084
dc.language.isospaes_MX
dc.publisherITESOes_MX
dc.rights.urihttp://quijote.biblio.iteso.mx/licencias/CC-BY-NC-2.5-MX.pdfes_MX
dc.subjectClasificación de Sonidos Ambientaleses_MX
dc.subjectCoeficientes Cepstrales de Meles_MX
dc.subjectData Augmentationes_MX
dc.subjectRed Neuronales_MX
dc.subjectRegularización con Dropoutes_MX
dc.titleProcesamiento de audio digital para la clasificación de sonidos urbanos a través de una red neuronales_MX
dc.typeinfo:eu-repo/semantics/masterThesises_MX
dc.type.versioninfo:eu-repo/semantics/acceptedVersiones_MX

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
tesis_lopezramon.pdf
Tamaño:
6.02 MB
Formato:
Adobe Portable Document Format
Descripción: