DMAF - Trabajos de fin de Maestría en Ciencia de Datos

URI permanente para esta colecciónhttps://hdl.handle.net/11117/7421

Examinar

Mostrando 1 - 20 de 85

Acceso Abierto
Forecasting Bitcoin’s Tendency with ConvLSTM Architecture
(ITESO, 2025-09-30) Contreras-González, César; Carrasco-Navarro, Rocío
Se presenta un modelo predictivo para la predicción en tiempo real del precio de Bitcoin, utilizando una arquitectura híbrida que combina Redes Neuronales Convolucionales (CNN) y Redes de Memoria a Corto y Largo Plazo Bidireccionales (Bi-LSTM), complementada con un mecanismo de atención de producto escalar. El modelo fue implementado usando TensorFlow y Keras, incorporando una función de pérdida personalizada y optimización de hiperparámetros mediante Keras Tuner. Utilizando un conjunto de datos de 15 características que incluyen indicadores financieros como RSI, MACD y Momentum, así como variables temporales. La investigación demuestra que el parámetro lookback es crucial para capturar la volatilidad del mercado, encontrando que períodos de 30 minutos son efectivos para mercados de alta volatilidad, mientras que 60 minutos funcionan mejor en condiciones estables, proporcionando una herramienta robusta para decisiones comerciales basadas en datos en el mercado de criptomonedas.
Acceso Abierto
El impacto del incremento salarial en México: un análisis con regresión distributiva
(ITESO, 2025-08) Leyva-Gómez, María A.; Ruíz-Hernández, María R.
Esta investigación analiza el impacto del aumento al salario mínimo en la distribución del ingreso salarial en México, a partir de las políticas implementadas durante el último sexenio. Para ello, se empleó la metodología de regresión distributiva, generando funciones de distribución acumulada (CDF) del ingreso por hora para 2018 y 2024, y construyendo una distribución contrafactual que aísla el efecto del salario mínimo. Los resultados revelan un efecto positivo en toda la distribución, con mayores aumentos en los percentiles bajos y altos, y aumentos más moderados en los segmentos medios. Esto contradice la idea de que el efecto se limita a los sectores más vulnerables, y confirma un impacto heterogéneo pero generalizado. Adicionalmente, se imputaron los ingresos faltantes, que representan casi el 30\% de los datos, utilizando modelos de machine learning. El XGBoost Regressor ofreció el mejor desempeño. La imputación incrementó significativamente el ingreso promedio, lo que confirma que los datos faltantes no son aleatorios. En conjunto, este trabajo muestra cómo herramientas de Ciencia de Datos pueden fortalecer el análisis económico, proporcionando estimaciones más precisas y revelando efectos que de otro modo podrían permanecer ocultos.
Embargo
Construcción predictiva automatizada de una serie de tiempo financiera corporativa con algoritmos dentro de un caso de estudio aplicado de Ciencia de Datos
(ITESO, 2025-08) Cárdenas-Cardeña, Mariely B.; Motta-Bonilla, Byron M.
En este documento se presenta el estudio y la aplicación de métodos de ciencia de datos sobre una base procesada, con el fin de mejorar la predicción financiera de un departamento operando para una empresa local de tecnología. Los ejecutivos y usuarios finales de dichas predicciones se apoyan de aquellos valores para la construcción de la estrategia corporativa, así como la toma de decisiones respectivas. Actualmente la operación en silos para la construcción de aquellos pronósticos evidencia la complejidad para reproducir dichos procesos. Aproximando a estas problemáticas algoritmos de aprendizaje de máquina y aprendizaje profundo puede resolver los retos que actualmente se enfrentan y dejar atrás procedimientos manuales. El presente documento contiene la investigación, aplicación y obtención de resultados en el desarrollo y construcción de un proceso más innovador y autónomo para la construcción de predicciones para periodos futuros. En términos numéricos y específicos, se espera una eficacia superior a 90% de precisión y un tiempo máximo 100 minutos para la ejecución. En este trabajo se encuentra el análisis exploratorio inicial del caso obtenido, así como la transformación de los datos para su utilización en modelos de ciencia de datos. Finalmente se presentan las experimentaciones empleadas, las conclusiones resultantes y propuestas para la continuación de mejoramiento a los avances reportados en este documento.
Acceso Abierto
Computationally Stable QCQP and SDP Multikernel Support Vector Regression Formulations
(ITESO, 2025-07) Álvarez-Álvarez, Gregorio A.; Sánchez-Torres, Juan D.
This study will explore alternative versions of the Multikernel Support Vector Regressor (SVR) algorithm. The two versions that will be explored include a derivation that uses an Objective-to-Constraint transformation to derive a Quadratically Constrained Quadratic Program (QCQP) algorithm with computational advantages over the earlier formulations. For the other approach, an innovative method to filter support vectors is used to increase numerical stability. This approach uses Lagrangian Duality and Semidefinite Programming (SDP) theory to derive a more general formulation. It will be shown that the alternative QCQP and SDP formulations provide computational advantages over their respective prior formulations, offering a more practical alternative to manual kernel design, especially in scenarios where using a multikernel is essential for problem construction, making it an ideal tool for researchers and practitioners.
Acceso Abierto
Recuerdos y redes: Detectando el Alzheimer antes del olvido
(ITESO, 2025-06) Galván-Blanco, Héctor A.; Alcalá-Temores, Jaime E.
El diagnóstico temprano de enfermedades neurodegenerativas como el Alzheimer es fundamental para mejorar la calidad de vida de los pacientes y facilitar una intervención médica oportuna. Este trabajo explora el uso de modelos de aprendizaje supervisado para clasificar el estado cognitivo de individuos: Cognitivamente Normal (CN), Deterioro Cognitivo Leve (MCI) y Alzheimer (AD), a partir de variables clínicas y demográficas estructuradas. Se implementaron y compararon dos enfoques: un modelo de regresión logística multinomial y una red neuronal profunda, desarrollada tras múltiples pruebas con arquitecturas de diferente complejidad. El proceso incluyó limpieza, codificación, normalización y selección de variables. La red neuronal, optimizada con múltiples capas densas y regularización, logró un desempeño superior, particularmente en la detección de la etapa MCI (recall = 81 %), considerada crítica por su relevancia clínica. Estos resultados refuerzan el potencial de las redes neuronales como herramienta de apoyo al diagnóstico temprano en contextos clínicos.
Acceso Abierto
Acceso al agua potable y relación con la pobreza en la zona metropolitana de Guadalajara
(ITESO, 2025-06) Peralta-Morfín, María L.; Silva-Gálvez, Arturo
Este trabajo analiza la relación entre el nivel socioeconómico (NSE) y la disponibilidad de agua potable en la Zona Metropolitana de Guadalajara. Se parte del problema del acceso desigual al agua y su impacto en comunidades con menores recursos. El objetivo es evaluar si existe una correlación entre estos factores, utilizando modelos estadísticos y de aprendizaje automático. Se emplearon datos del Censo de Población y Vivienda 2020 del INEGI y del índice de NSE calculado por la AMAI. A partir de estos, se aplicaron distintos modelos: regresión lineal, regresión logística, árboles de decisión (regresión y clasificación) y una red neuronal multicapa. Las variables consideradas incluyeron indicadores de acceso al agua como presencia de agua entubada, tinacos y cisternas. Los modelos de regresión mostraron un bajo ajuste, con coeficientes R² cercanos a cero. Los modelos de clasificación aumentaron considerablemente en desempeño, siendo la red neuronal la que alcanzó la mayor precisión con un valor de 62.74 %. Los modelos sugieren una relación entre el NSE y el acceso al agua, pero sí revelan diferencias en el tipo de abastecimiento. La variable con mayor peso fue el acceso a agua entubada (VIV_3), el acceso a agua entubada y saneamiento está más presente en zonas con NSE alto, mientras que las zonas con menor NSE muestran una mayor dependencia de tinacos y cisternas. Los resultados también indican la falta de indicadores clave que limitan la capacidad para establecer una relación clara entre el NSE y el acceso al agua. Por ello, se recomienda ampliar la recopilación de datos para incluir variables adicionales que permitan un análisis más profundo y robusto de esta problemática.
Acceso Abierto
Modelo Híbrido Prophet/XGBoost Para Predicción Demanda de Inventarios Retail Automotive Aftermarket
(ITESO, 2025-04) Iñiguez-García, Abraham; Silva-Gálvez, Arturo
La toma de decisiones fundamentada en datos se ha convertido en una necesidad imperativa para las empresas que buscan no solo mantenerse competitivas en el mercado actual, sino también impulsar un crecimiento sostenible a largo plazo. En un entorno empresarial cada vez más dinámico y complejo, confiar únicamente en la intuición o en experiencias pasadas ya no es suficiente. El análisis de datos permite a las organizaciones identificar patrones, predecir tendencias y tomar decisiones informadas que minimicen riesgos y maximicen oportunidades. Este proyecto se enfoca en la predicción de demanda de inventario de empresas en el sector de venta de piezas automotrices retail con el objetivo de que las decisiones estratégicas de la dirección se basen en datos sólidos, permitiendo así una mayor precisión y efectividad. Al implementar un enfoque basado en datos, se busca optimizar la planificación de recursos, anticipar las necesidades del mercado y mejorar la rentabilidad de la empresa. De esta manera, la compañía estará mejor equipada para tomar decisiones informadas que promuevan un crecimiento sostenible y una ventaja competitiva en su sector. Para el desarrollo de este proyecto, se utilizaron conjuntos de datos generados a partir de las bases de datos del sistema ERP productivo de una empresa perteneciente al ramo. Para el análisis de la predicción de demanda de inventario se implementó un algoritmo de series de tiempo llamado Prophet, así como algoritmo de machine learning XGBOOST que en conjunto crean un modelo híbrido donde tomamos las ventajas de ambos. El estudio comparó diversos modelos de predicción de demanda, demostrando que los enfoques modernos como Prophet y el Modelo Híbrido superan significativamente a los métodos tradicionales (ARIMA, ETS y Promedios Históricos), mostrando mayor precisión y adaptabilidad a fluctuaciones en los datos. XGBOOST y su versión mejorada presentaron un desempeño intermedio, superando a los modelos clásicos pero sin alcanzar el rendimiento de Prophet. Se evidenció la baja efectividad del modelo de Promedios Históricos, actualmente utilizado por la empresa, destacando la necesidad de adoptar técnicas más avanzadas. Además, el procesamiento riguroso de los datos excluyendo períodos irregulares y ajustando por eventos atípicos como la pandemia fue clave para garantizar resultados robustos. Estos hallazgos resaltan la importancia de implementar modelos adaptativos en entornos con alta variabilidad en la demanda.
Embargo
Aplicación de técnicas de ciencia de datos para el diseño de estrategias en Mentoralia A.C.
(ITESO, 2025-06) Aguilar-Zúñiga, Laura S.; Silva-Galvez, Arturo
Technovation Girls es un programa global y virtual dirigido a niñas de 8 a 18 años, cuyo objetivo es desarrollar habilidades en tecnología y emprendimiento a través de un programa de doce semanas, al final del cual entregan un proyecto. En México, el programa es coordinado por Mentoralia A.C., una asociación sin fines de lucro que busca formalizar esfuerzos y establecer alianzas con instituciones educativas y empresas tecnológicas para promover la participación femenina en STEM. Un reto importante que enfrenta Mentoralia es la alta deserción: muchas estudiantes se inscriben, pero no completan el programa. Este estudio tiene como finalidad identificar un modelo predictivo que permita predecir si una estudiante completará el programa, así como encontrar los factores clave que influyen en su permanencia. En el estudio se usó la base de datos de participantes en México durante el periodo 2020–2024. Primero, se realizó un análisis exploratorio considerando variables como el año, número de estudiantes y mentores por equipo. Luego, se aplicó un análisis bivariado para comparar estas variables con la tasa de finalización. Se entrenaron modelos de Regresión Logística, PBC4cip, SVC y Redes Neuronales, evaluados mediante precisión, recall, F1-score y AUC-ROC. Además del desempeño, se analizaron las variables más influyentes en la predicción. Estos hallazgos pueden guiar estrategias futuras para mejorar la retención y apoyar la participación femenina en ciencia y tecnología mediante enfoques basados en datos.
Acceso Abierto
Regularization of Visual Transformers and Reinforcement Learning: an Approach to General Artificial Intelligence Evaluated through the ARC Benchmark
(ITESO, 2025-05) Oviedo-Vázquez, Mario A.; Guerrero-Arroyo, Edgar A.
El auge de los Transformers y los modelos de lenguaje autorregresivos ha impulsado su uso en diversos campos, pero también ha expuesto sus limitaciones, como la incapacidad de resolver problemas simples que se encuentren fuera de los datos de su entrenamiento, lo que refleja deficiencias en comprensión, razonamiento y planificación. Estas habilidades son esenciales para aplicaciones críticas, autos autónomos o aplicaciones médicas, donde se requiere adaptabilidad a situaciones imprevistas. Esta tesis propone un modelo que combina un Transformers con codificador visual modificado (ViT) y aprendizaje por refuerzo (RL) para abordar estas limitaciones. La evaluación se realiza con el Abstraction and Reasoning Corpus (ARC), un benchmark creado para medir habilidades cognitivas en IA, que hasta ahora no ha sido superado por otros modelos.
Acceso Abierto
Sistema de recomendación de productos en manufactura utilizando filtrado colaborativo
(ITESO, 2025-05) Martínez-Guzmán, Quetzalcoatl; Silva-Gálvez, Arturo
La personalización en la recomendación de productos representa un reto clave para empresas con un amplio catálogo y una base diversa de clientes. En este trabajo, se aborda el problema de identificar productos que podrían interesar a los clientes de una empresa mexicana dedicada a la fabricación y distribución de herrajes y accesorios para aluminio y vidrio, con base en su historial de compras del último semestre. Actualmente, la empresa no emplea un sistema formal de recomendación, y las ventas se apoyan en la experiencia de los vendedores y en relaciones comerciales establecidas. Esto limita el alcance de posibles sugerencias personalizadas que podrían incrementar el volumen de ventas o generar retroalimentación valiosa por parte de los clientes. La hipótesis de este trabajo plantea que un sistema de recomendación basado en filtrado colaborativo puede detectar afinidades entre clientes y productos no adquiridos previamente, mejorando así la oferta comercial. Para probar esta hipótesis, se analizó el historial de compras en unidades vendidas, clasificando los productos de forma ordinal por cliente y aplicando diferentes métricas de similitud para generar recomendaciones. Se compararon los diferentes métodos con base en precisión, recall, hit rate y MAE. Los resultados muestran que es posible identificar productos relevantes para cada cliente con base en su comportamiento de compra y en las similitudes con otros clientes. Esta afirmación se respalda con la validación práctica del sistema, ya que las recomendaciones generadas fueron ofrecidas a clientes de prueba, logrando concretar ventas reales. Algunos algoritmos superaron a otros en términos de precisión y cobertura, evidenciando que la elección de la métrica de similitud y el enfoque colaborativo afectan directamente la calidad de las recomendaciones. Se concluye que los sistemas de recomendación colaborativos pueden complementar la labor de la fuerza de ventas al ofrecer sugerencias personalizadas, generando oportunidades de negocio adicionales y abriendo la puerta a decisiones comerciales más informadas y orientadas por datos.
Acceso Abierto
Pronóstico de ventas de tiendas de abarrotes en Zona Metropolitana de Guadalajara
(ITESO, 2025-05) García-Hernández, Daniel; Motta-Bonilla, Byron M.
Las tiendas de abarrotes de la zona metropolitana de Guadalajara compiten actualmente en un mercado en el que predominan cadenas de conveniencia, las cuales cuentan con recursos y ventajas significativas. En este contexto, resulta fundamental que los abarrotes independientes dispongan de herramientas predictivas que les permitan planificar sus ventas diarias con precisión. Este trabajo tiene como objetivo desarrollar un modelo matemático para la predicción de las ventas diarias de las tiendas de abarrotes dentro de la zona metropolitana de Guadalajara. La finalidad es proporcionar una herramienta de pronóstico que permita a estos negocios anticipar sus ventas diarias, optimizando así la toma de decisiones estratégicas. Para lograrlo, se propone un modelo SARIMA, debido a que las ventas diarias de este tipo de establecimientos presentan una fuerte estacionalidad semanal y estacionariedad. Estas características hacen que el modelo SARIMA sea una opción adecuada y efectiva para captar patrones temporales y proporcionar predicciones precisas, de igual manera se incorporan a este modelo el uso de variables exógenas, las cuales son variables externas que pueden afectar el comportamiento de la serie a pronosticar en este caso las ventas diarias, por medio del modelo StatsForecast de la paquetería Nixtla.
Acceso Abierto
A Comparative Analysis of Algorithms to Address the Imbalanced Dataset Problem in Federated Learning
(ITESO, 2025-05) Durán-González, Erika S.; Gudiño-Mendoza, Gema B.
Traditional training in Machine Learning (ML) algorithms requires data collected from various devices to be transferred to a central server, which poses potential security and data-privacy risks. An additional critical aspect of machine learning is class imbalance, which arises when certain classes are underrepresented, potentially leading to suboptimal performance, particularly for minority class data. Different approaches such as oversampling, undersampling, and synthetic data creation have been developed for machine learning to overcome this problem. Federated Learning (FL) is a promising privacy-preserving Artificial Intelligence (AI) framework that addresses the challenges presented in traditional machine learning training. In federated learning, class imbalance may also occur, but the previously mentioned approaches in machine learning are not directly applicable. In federated learning, the class distribution is unknown to protect privacy. Several federated learning algorithms have been developed to address this problem. This thesis aims to implement and compare three federating learning algorithms designed to address the class imbalance problem: Combinatorial Upper Confidence Bounds (CUCB), CLass IMBalance Federated Learning (CLIMB), and Federated Feature Distillation (FedFed). Three different data distributions were tested: label imbalance, quantitative imbalance, and double imbalance. To provide common ground for algorithm comparison, the implementation considers the same dataset and data pre-processing, the same neural network model, and hype-parameter training. After implementation, the results showed that CUCB had the best convergence rate, which is due to the algorithm inferring the data distribution from the test dataset. CLIMB addresses the local and global mismatch imbalance type, making the algorithm more robust and exhibiting the best performance in all data distributions. The FedFed does not perform as anticipated, despite utilizing the latest advancements in generative AI. Further exploration needs to be done in this implementation, where a complex environment is tested, such as increasing the number of clients.
Acceso Abierto
Modelo de Predicción para Empresa de Logística y Paquetería
(ITESO, 2025-05) Aguilar-Casillas, Alejandro M.; Motta-Bonilla, Byron M.
Este trabajo presenta una breve introducción al problema de una predicción de puntualidad en la entrega de envíos en una empresa transnacional de logística. El objetivo principal es desarrollar un modelo de análisis que permita optimizar la asignación de recursos y mejorar la precisión en los tiempos de entrega, aumentando así la satisfacción del cliente y reduciendo costos operativos. En particular, se aborda la relación entre el peso de los envíos, la frecuencia de operaciones y los costos logísticos asociados, utilizando técnicas de ciencia de datos y aprendizaje automático. El desarrollo del trabajo incluye la implementación de cuatro modelos: Máquina de Vectores de Soporte (por sus siglas en inglés SVM), Red Neuronal (Perceptrón Multicapa), Regresión Logística y XGBoost, evaluados según su capacidad para predecir la puntualidad de los envíos. Los resultados obtenidos muestran que la Regresión Logística es el modelo más efectivo, logrando un balance entre precisión, recuperación y exactitud, lo que lo convierte en la mejor opción para optimizar la operación logística en términos de confiabilidad y costos. Finalmente, se presentan las conclusiones, resaltando que este modelo permite a la empresa prever problemas y ajustar su estrategia operativa para cumplir con los tiempos de entrega establecidos en los contratos. La contribución principal de este trabajo radica en proporcionar un modelo analítico que optimiza la gestión de entregas y fortalece la competitividad de la empresa en el mercado global.
Acceso Abierto
Detección de imágenes DeepFake con Vision Transformers (ViT)
(ITESO, 2025-05) Retolaza-Carlos, Oscar G.; Villalón-Turrubiates, Iván E.
La accesibilidad a estos modelos ha promovido en gran medida la creación y distribución de contenido multimedia manipulado. La sofisticación de estos sistemas, combinada con la facilidad de uso y el acceso prácticamente a unos cuantos clics, ha permitido generar imágenes y videos hiperrealistas, que pueden emplearse tanto para el entretenimiento y la producción artística como también para fines poco éticos. Ejemplos particularmente preocupantes incluyen la creación de videos pornográficos falsos, en los cuales se utilizan imágenes cotidianas de una víctima para generar cuerpos desnudos hiperrealistas que luego son explotados comercialmente sin el conocimiento ni consentimiento de la persona afectada; la divulgación de noticias falsas o incluso la suplantación de identidad. Este avance conlleva retos éticos y sociales, porque el uso indebido de estas tecnologías podría propagar desinformación, crear sesgos o inclusive vulnerar la integridad de comunidades enteras. En particular, este trabajo aborda el uso de Vision Transformers (ViT), un modelo de deep learning, con la finalidad de contribuir a la creación de herramientas que adviertan sobre la autenticidad del material. Esto es crucial para un consumo responsable y seguro de la información. Por ello, el presente trabajo se centra en evaluar Vision Transformers (ViT) como método de clasificación de imágenes reales frente a falsas, conocidas también como DeepFakes, analizando sus fortalezas, limitaciones y vías de mejora. Con ello se busca contribuir a soluciones más efectivas que promuevan un uso ético y confiable de los medios digitales.
Embargo
Advanced Deep Learning Techniques for USD/MXN Structured Notes Predictive Modeling
(ITESO, 2025-06) Ramos-Martínez, Ricardo; Campos-Macías, Leobardo E.
This thesis investigates whether modern neural networks can enhance the issuance and selection of capital-protected structured notes in the Mexican market, concentrating on instruments linked to the USD/MXN exchange rate. Standard feed-forward and shallow recurrent models were first applied to a broad spectrum of payoff profiles—range accruals, double no-touch, and directional notes—but delivered limited out-of-sample stability and negligible economic value. Reframing the problem as a binary 7-day USD/MXN direction forecast narrowed the note universe to Strike Up and Strike Down structures and allowed the training set to extend back to 2010. A dual-stream GRU architecture was developed in which technical indicators (momentum, oscillators) and fundamental drivers (rate differentials, macro surprises) flow through parallel recurrent branches before merging in a shared decision layer. Bayesian hyper-parameter optimisation selected a compact configuration (five layers, 372 hidden units, dropout 0.3). When evaluated on 2024 out-of-sample data, the model achieved Accuracy = 64.7%, F1 = 71.7%, and AUC = 0.60, comfortably outperforming ARIMAX, logistic regression, and decision-tree baselines. The cumulative true-positive excess return (TPefe) tracked the CETE-28 benchmark within approximately ten basis points after embedded structuring fees, demonstrating commercial viability for investors who require weekly liquidity, principal protection, and yields at least equal to the domestic risk-free rate. The study shows that separating technical and fundamental information into dedicated recurrent channels, coupled with gated-unit dynamics and commission-aware evaluation, provides a robust and scalable template for machine-learning-driven structured-note selection in Mexico’s evolving markets.
Acceso Abierto
Analysis and Implementation of Different Open-Source Federated Learning Frameworks to Assess their Technical Implications
(ITESO, 2025-05) Juan-Fernández, Antonio J.; Gudiño-Mendoza, Gema B.
Google introduced Federated Learning, an approach to decentralized machine learning model training, in 2016. It is designed to allow the use of private data to train machine learning models without the need to possess the data or even "see" it. The main premise of Federated Learning is a paradigm shift from the traditional centralized machine learning training workflow to a distributed setting. In this setting, users carry out the training locally without ever revealing their data and only share the results of their efforts anonymously as model parameter updates, either to a local server or a network of other users. Over the years, several Federated Learning frameworks have emerged, each offering different sets of settings and serving either a broad or a particular purpose. While several comparisons have been made to determine the framework with the most comprehensive set of features, no comparison is available to assess their utility and the implications of using them at an empirical level. This case study uses the popular frameworks NVFlare, Flower, and Federated Scope to evaluate and showcase their main strengths and potential drawbacks, emphasizing the use of an external dataset and model. The results showed that regardless of whether the frameworks displayed considerable strengths in certain areas, there is still room for improvement, and that, even if they simplify the implementation of Federated Learning, a factor of manual work still needs to be taken into account, regardless of the framework at hand. Ultimately, the frameworks have relevant features and areas of opportunity that anyone looking to adopt Federated Learning will need to consider; however, the technical analysis should give a broad perspective on the implications of using the chosen frameworks.
Acceso Abierto
Modelo híbrido para la detección de deepfakes mediante YOLOv3 y análisis espectral con la Transformada de Fourier
(ITESO, 2025-05) Gómez-Reyes, Uriel; Villalón-Turrubiates, Iván E.
El aumento exponencial en la generación y propagación de deepfakes, sumado al crecimiento de herramientas que promueven su desarrollo, ha originado la necesidad creciente de verificar los contenidos en línea. La posibilidad de que cualquier persona pueda acceder a esta tecnológica sin ninguna dificultad, junto con su asombrosa habilidad para crear rostros hiperrealistas, presenta serios desafíos para su identificación a través de métodos tradicionales. Este trabajo propone un modelo híbrido que combina el modelo de detección de objetos YOLOv3 sumado con el análisis en el dominio de la frecuencia mediante la Transformada Discreta de Fourier (DFT) y el uso de una Red Neuronal ResNet50 para su clasificación. El modelo utiliza el algoritmo YOLOv3 como una herramienta de visión computacional que permite localizar y extraer las regiones faciales de interés, disminuyendo el ruido del entorno, seguido de un análisis espectral con DFT que permite identificar patrones de alta frecuencia que son característicos de imágenes creadas con herramientas de deepfake. Por último, se entrena un modelo de clasificación con representaciones espectrales de los conjuntos de datos que incluyen imágenes reales y falsas. Esto permite al modelo aprender los patrones de ambos datasets y distinguir entre una imagen real y una falsa. Los resultados que se obtuvieron como resultado de este trabajo demuestran que el enfoque híbrido propuesto puede lograr una mejora significativa en la precisión de detección respecto a métodos básicos basados exclusivamente en el dominio espacial. Este estudio aporta evidencia sobre la efectividad del análisis de frecuencia como una herramienta más para combatir este tipo de contenido. Combinado con técnicas de visión por computadora, muestra una posible solución para los retos que presenta esta nueva década, dominada por la inteligencia artificial.
Acceso Abierto
Comparación de modelos predictivos aplicados a las cuartas oportunidades en la NFL
(ITESO, 2025-02) Cañedo-Richart, Rafael A.; Alcalá-Temores, Jaime E.
El presente trabajo presenta los resultados derivados de la implementación y evaluación de distintos modelos de clasificación, diseñados para anticipar el desenlace de las cuartas oportunidades en juegos de la NFL. Estos modelos se contrastan con un enfoque de clasificación estándar, representado por una regresión logística simple. Durante el proceso de experimentación, se seleccionaron modelos de Machine Learning que se ajustaran a la naturaleza del problema y la estructura de los datos, apoyados por un análisis estadístico. Además, se implementaron los modelos, y se ofrece una comparación entre ellos mediante diversas pruebas y manipulaciones que respaldan la robustez de los resultados. Si bien se lograron mejorar categóricamente los resultados obtenidos por la regresión logística, los modelos propuestos encontraron limitaciones debido a la naturaleza del problema, que posee un fuerte componente aleatorio. En el apartado de conclusiones y trabajo futuro, se proporcionan reflexiones generales sobre el grado de incertidumbre epistémica de los modelos, y se propone como trabajo futuro realizar análisis de naturaleza bayesiana para comprender de manera integral la incertidumbre total de los modelos (epistémica o del modelo y aleatoria o de los datos).
Acceso Abierto
Machine learning en mercados financieros: generando predicciones mediante la clasificación lorentziana y vecinos más cercanos aproximados
(ITESO, 2024-12) Tinoco-Figueroa, Sergio; Rodríguez-Reyes, Luis R.
Este trabajo aborda el complejo y multivariado problema de predecir la dirección del precio de un activo financiero con el objetivo de generar un indicador tanto de compra como de venta de dicho activo, ofreciendo soluciones específicas para eliminar las suposiciones humanas y reducir las señales falsas al realizar transacciones. El indicador propuesto demuestra su capacidad para categorizar datos históricos en un espacio de características multidimensional, subrayando la utilidad de la Clasificación por Distancia de Lorentz (LDC, por sus siglas en inglés) al predecir la dirección futura de los movimientos de precios mediante la implementación de un algoritmo de Vecinos Más Cercanos Aproximados (ANN, por sus siglas en inglés). Para este estudio, se analizaron datos históricos de precios correspondientes al par dólares por Bitcoin (BCH/USD), abarcando un período de 60 días y una periodicidad de 15 minutos, lo que resultó en la recopilación de más de 5,000 registros de datos. Estos datos permitieron obtener una base sólida para el análisis y entrenamiento del modelo de clasificación. Los resultados obtenidos durante el desarrollo del estudio destacaron la eficacia del LDC, un algoritmo de clasificación de Aprendizaje Automático optimizado a través de un riguroso proceso de pruebas. Tras una ejecución en tiempo real, el modelo logró ejecutar 70 operaciones con una tasa de éxito del 92.86%, alcanzando 65 operaciones ganadoras frente a solo 5 perdedoras. Además, se obtuvo una acumulación total de 3,056.02 PIPs, lo que refleja un rendimiento positivo sostenido en el periodo evaluado. El Ratio de Sharpe fue de 0.13, lo que, aunque indica un riesgo moderado, se compensa por la alta tasa de aciertos y la consistencia de las ganancias. En última instancia, se concluye proponiendo un modelo de aplicación automático basado en sistemas en la nube. Este modelo implementa los algoritmos desarrollados de manera autónoma, generando transacciones de manera eficiente y objetiva. Este enfoque proporciona una herramienta valiosa para mejorar la precisión y la confiabilidad en las decisiones financieras, contribuyendo así al avance y la eficacia de las estrategias de trading en entornos volátiles y complejos como el mercado de criptomonedas.
Acceso Abierto
Levenberg-Marquardt Algorithm
(ITESO, 2025-01) Díaz-Sánchez, Jorge A.; Ruíz-Cruz, Riemann
This research presents an efficient Levenberg-Marquardt implementation for neural network training in regression, classification, and transfer learning. While Levenberg-Marquardt offers fast convergence and precision in nonlinear least-squares problems, its high memory and computational demands limit its use in large models. This work optimizes Levenberg-Marquardt to improve its practicality across diverse architectures by addressing these constraints. A key contribution is integrating Levenberg-Marquardt into PyTorch, a widely used deep learning framework. This enables easier adoption, leveraging PyTorch’s GPU acceleration and parallelization for improved efficiency. By minimizing redundant calculations in the Jacobian and Hessian approximations, this implementation significantly reduces memory usage and computational overhead. Instead of merely optimizing storage, it selectively applies Levenberg-Marquardt where needed, balancing second-order precision with resource constraints. Experiments validate Levenberg-Marquardt’s efficiency on benchmark tasks, including MNIST classification and fine-tuning AlexNet. Comparisons with Adam and SGD show that Levenberg-Marquardt achieves competitive accuracy with fewer epochs, making it a viable alternative in high-precision scenarios. In transfer learning, limiting trainable parameters helps mitigate memory concerns. This research demonstrates that Levenberg-Marquardt can be an efficient neural network optimizer when resource management is prioritized. By refining its implementation, Levenberg-Marquardt becomes more practical for deep learning, particularly in tasks requiring fast convergence and high accuracy. Future work will explore further memory optimizations and extensions for high-dimensional datasets, broadening Levenberg-Marquardt’s applicability in modern neural network training.

Examinar

Envíos recientes