DMAF - Trabajos de fin de Maestría en Ciencia de Datos

URI permanente para esta colección

https://hdl.handle.net/11117/7421

Examinar

Mostrando 1 - 14 de 14

Anomaly Detection for Cloud Services
(ITESO, 2024-05) Ceja-Fuentes, Erick; Alcalá-Temores, Jaime E.
El estudio presentado en este trabajo de investigación se centra en el análisis de métricas en un sistema basado en la nube. Las métricas se recopilan de diferentes fuentes con distintos niveles de agrupación. Esto crea un entorno ideal para explorar modelos de clasificación.El objetivo principal de este estudio es encontrar correlaciones entre las diferentes fuentes de estas métricas. En particular, el estudio tiene como objetivo examinar los grupos de instancias de la nube e identificar las relaciones entre ellos.Se exploraron varios modelos para analizar las métricas. Después de una cuidadosa consideración, se determinó que los árboles de decisión eran el mejor modelo a utilizar para este tipo de datos. Los árboles de decisión ofrecen varias ventajas para este tipo de análisis, incluida su capacidad para manejar estructuras de datos complejas y su facilidad de interpretación.Los resultados del estudio fueron positivos. Al utilizar árboles de decisión, se mejoró enormemente la clasificación de los diferentes grupos de instancias de la nube. Este éxito demuestra la utilidad de los árboles de decisión para analizar estructuras de datos complejas y puede tener implicaciones para futuros estudios en esta área.
Aplicación de modelos Transformer para la clasificación y análisis de quejas en atención al cliente
(ITESO, 2024-05) Rojas-Villanueva, Enrique I.; Alcalá-Temores, Jaime E.
En este trabajo, se adoptó una metodología mixta para explorar el impacto de los modelos de Procesamiento de Lenguaje Natural (Natural Language Processing, NLP, por sus siglas en inglés) basados en Transformers, enfocándose específicamente en su capacidad para analizar e interpretar texto. La investigación se centra en evaluar la efectividad y eficiencia de estos modelos al procesar y categorizar interacciones textuales específicas. Dicho análisis se realiza sobre una muestra cuidadosamente seleccionada de 3,000 interacciones en forma de tickets de atención al cliente, provenientes de diversos canales de comunicación digital. Este enfoque permite no solo comprender cómo los modelos de Transformers pueden identificar y clasificar los diferentes tipos de consultas y problemas reportados por los usuarios, sino también evaluar su precisión, la cual se espera alcance al menos el 90 % en la identificación de categorías relevantes. La elección de tickets de atención al cliente como objeto de estudio se debe a su riqueza informativa y relevancia para las empresas que buscan optimizar sus estrategias de servicio y soporte al cliente mediante tecnologías de NLP.
Aprendizaje profundo en el caucho. Mejora del proceso de manufactura mediante la predicción de propiedades
(ITESO, 2024-01) Manzo-Rosas, Carlos A.; Alcalá-Temores, Jaime E.
Estrategia de mercadotecnia eficiente: segmentación de canales de venta y clasificación de clientes
(ITESO, 2025-01) Ramírez-Islas, Ricardo; Alcalá-Temores, Jaime E.
El grupo International Lean Six Sigma, empresa especializada en certificaciones de mejora continua en los sectores de manufactura y servicios, cuenta con procesos de venta físicos y en línea. El Trabajo que a continuación se presenta ofrece una solución que tuvo como primer objetivo la generación de segmentos estratégicos para ventas en línea, y como segundo objetivo, la clasificación de nuevos clientes en los nuevos segmentos para medir la eficiencia de las campañas de mercadotecnia. Cabe destacar que se realizaron técnicas de procesamiento de datos previos a la implementación de modelos. Para el primer objetivo, se implementó el modelo de segmentación K-means donde se realizaron varios experimentos para obtener el número óptimo de clases. Se concluyó que la segmentación óptima fue de 3 clases, estas agrupaciones resultantes se presentaron como los nuevos segmentos estratégicos para lanzar campañas de mercadotecnia. Para el segundo objetivo, se experimentó y evaluó con varios modelos de clasificación como árbol de decisión, regresión logística y red neuronal. Se concluyó que todos ellos proporcionaban buenos resultados para predecir el segmento de nuevos clientes, sin embargo, el árbol de decisión demostró ser el modelo más eficiente y adecuado para implementar por los resultados demostrados en este trabajo y por las características demandadas por el negocio.
Estrategias de machine learning para la personalización de tasas de interés en Fintech. Un enfoque con LGBM y S Learner
(ITESO, 2024-05) Vilchis-Sánchez, Sofía; Alcalá-Temores, Jaime E.
Este trabajo innova en la optimización de micropréstamos mediante la personalización de tasas de interés, empleando modelos avanzados de Light Gradient Boosting Machine (LightGBM). A través de experimentos, se examina cómo diferentes ajustes afectan la precisión y eficacia de modelos de clasificación y regresión. Se seleccionaron los modelos más efectivos para integrar un enfoque de ganancia ponderada en recurrencia, aplicando la metodología de S-learner con diversas tasas de interés, buscando maximizar la ganancia del usuario. Este enfoque logró mejorar la personalización de tasas de interés y aumentar las ganancias en un 7% sin afectar la recurrencia de los préstamos, sugiriendo un cambio de paradigma hacia un sector Fintech más inclusivo y centrado en el usuario. El estudio abre caminos para futuras investigaciones en personalización de servicios financieros, explorando nuevas áreas y mejorando la rentabilidad de los micropréstamos, promoviendo un sector Fintech equitativo e inclusivo.
Implementación de modelos de predicción para la mejora de gestión de inventarios
(ITESO, 2024-06) Gómez-Flores, Isaac G.; Alcalá-Temores, Jaime E.
Este trabajo ofrece una introducción al desafío fundamental de mejorar la precisión en los pronósticos que se usan para la gestión de inventarios y sus efectos en la cadena de suministro. Los pronósticos inexactos pueden provocar desbalances en la gestión de inventarios, lo que implica costos de almacenamiento, posibles costos de desecho de productos sobrantes y gastos extra por tener que apresurar órdenes. Además, puede ocasionar problemas con los clientes y pérdida de ventas de productos. El objetivo principal de este proyecto es proponer una alternativa para la generación de pronósticos de ventas de productos para dos unidades de negocios de la empresa donde el autor participa. Para lograr este objetivo, se realizarán las siguientes acciones: obtener, transformar y crear un conjunto de datos para el análisis, construir modelos de pronóstico estadísticos y de aprendizaje automático, seleccionar los mejores modelos por tipo de producto y comparar las predicciones obtenidas con las estimaciones internas compartidas. Los resultados muestran que, para algunos productos, los modelos desarrollados presentaron una disminución significativa del error en comparación con el método utilizado actualmente. Sin embargo, para otros productos, los errores fueron mayores. En general, los modelos estadísticos tuvieron un mejor rendimiento que los modelos de aprendizaje automático. Finalmente fue posible sugerir una alternativa para la elaboración de pronósticos de ventas en las distintas unidades de negocio, planteando una forma de optimizar los inventarios mediante predicciones más precisas obteniendo para algunos productos una mejora en comparación con el método utilizado actualmente.
Modelado predictivo con Random Forest para la detección de enfermedades cardíacas
(ITESO, 2024-05) Estrada-Rodríguez, Héctor D.; Alcalá-Temores, Jaime E.
El diagnóstico precoz de enfermedades cardíacas permite mejorar la probabilidad de supervivencia de las personas, así como reducir los gastos adicionales al sistema de salud. Es por esto que el objetivo principal de este proyecto es aplicar un modelo de detección de patologías cardíacas, resolviendo de manera particular la necesidad de herramientas analíticas avanzadas que puedan procesar datos clínicos y biomédicos de manera efectiva. Se destaca la implementación y comparación de un modelo de Random Forest frente a la Regresión Logística, así como los procesos de limpieza, preparación de datos y la ingeniería de características realizada. Se exponen los resultados obtenidos, que demuestran la superioridad predictiva del Random Forest en comparación con la Regresión Logística. Finalmente, se presentan las conclusiones del trabajo, enfatizando la viabilidad del Random Forest para la aplicación clínica.
Predicción a largo plazo del movimiento del precio de acciones bursátiles con base en sus estados financieros
(ITESO, 2024-11) Topete-Salazar, Alan O.; Alcalá-Temores, Jaime E.
En este trabajo, se replican algunos resultados obtenidos por Milosevic (2016) para predecir el movimiento de precios de acciones a largo plazo. El presente estudio contrasta en que se evalúan a las empresas con mayor capitalización de mercado en Estados Unidos, a comparación del estudio original que estudiaba compañías con capitalización media del mercado americano y europeo. A través de una revisión del trabajo previo, este estudio busca mejorar la precisión de las predicciones del movimiento de precios de acciones a largo plazo utilizando técnicas avanzadas de aprendizaje automático y comparar el rendimiento con métodos previamente propuestos. Se introducen nuevos modelos y técnicas, y se comparan con el enfoque anterior para evaluar su rendimiento. Se analiza la importancia de las características utilizadas en los modelos para entender mejor qué factores influyen más en las predicciones. Finalmente se proponen recomendaciones para futuros investigadores en el área basados en los hallazgos obtenidos.
Predicción de comportamiento crediticio
(ITESO, 2023-09) Villarreal-Palomino, Aldo E.; Alcalá-Temores, Jaime E.
Procesamiento del lenguaje natural para el modelado de tópicos en ideas de innovación
(ITESO, 2024-11) Corona-Bermúdez, Michel C.; Alcalá-Temores, Jaime E.
Este trabajo propone mejorar la evaluación y priorización de ideas de innovación mediante Procesamiento de Lenguaje Natural (NLP, por sus siglas en inglés) y modelado de tópicos. Se aborda la necesidad de automatizar el análisis de ideas para facilitar su implementación en las empresas. El objetivo principal es identificar el modelo más adecuado para extraer temas relevantes de ideas empresariales, evaluando modelos como LDA y BERTopic en términos de coherencia y perplejidad. La metodología incluye el preprocesamiento de los datos textuales, comenzando con la detección de idioma y traducción al inglés para estandarizar las ideas. Posteriormente, se aplica tokenización, eliminación de palabras comunes y stemming para reducir palabras a su forma base. Esto permite generar representaciones numéricas, que los modelos de tópicos pueden analizar. Los resultados muestran que el modelo BERTopic supera a LDA en coherencia, facilitando la segmentación e interpretación de ideas. Finalmente, el trabajo sugiere áreas de mejora, como la optimización de modelos y su despliegue en plataformas como Amazon SageMaker, lo que permitirá una integración eficiente en entornos empresariales. Este estudio contribuye a la automatización del análisis de ideas de innovación, ofreciendo una herramienta para que las empresas analicen grandes volúmenes de información de manera rápida y efectiva.
Pronósticos de costos por obligaciones de garantías a corto plazo
(ITESO, 2023-06) Nuño-Álvarez, Daniel F.; Alcalá-Temores, Jaime E.
Segmentación de clientes para un E-commerce soportado en Shopify
(ITESO, 2024-02) Lagunas-Barba, Daniel; Alcalá-Temores, Jaime E.
Segmentación de prendas de vestir por medio de la utilización de algoritmos de Computer Vision y Deep Learning
(ITESO, 2024-01) Medina-Anguiano, Alex; Alcalá-Temores, Jaime E.
Sistema de clasificación de ordenes de supresión
(ITESO, 2024-05) Durán-Valencia, Thaitiel J.; Alcalá-Temores, Jaime E.
El sistema de órdenes de supresión policial (PSOS, por sus siglas en inglés) comienza como un proyecto Call for Code en colaboración con la Asociación Nacional de Abogados de Defensa Criminal (NACDL) para construir una base de datos utilizando inteligencia artificial para ayudar a rastrear las órdenes de supresión judiciales. El alcance del proyecto se ha ampliado para rastrear cualquier mala conducta policial. El resultado final utilizaría la inteligencia artificial, en específico Procesamiento de Lenguaje Natural (Natural Language Processing, NLP por sus siglas en inglés) para eliminar cientos de miles de horas de trabajo manual en el intento de crear y mantener una base de datos que identifique el comportamiento problemático de la policía. Este trabajo se centró en un problema de clasificación de texto, cuyo objetivo principal fue explorar cuáles son los métodos de aprendizaje automático supervisado más efectivos para abordarlo.

Examinar

Examinando DMAF - Trabajos de fin de Maestría en Ciencia de Datos por autor "Alcalá-Temores, Jaime E."

Resultados por página

Opciones de ordenación