|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2024-25
Predicción de fallos en flotas de camiones pesados: Un enfoque basado en modelos de aprendizaje automático para el mantenimiento preventivo |
Tecnologías Específicas
Computación
Descripcion y Objetivos
El mantenimiento predictivo es una técnica clave para optimizar la eficiencia operativa en la industria del transporte. Anticipar fallos en los componentes de una flota de vehículos puede reducir los tiempos de inactividad, mejorar la seguridad y reducir los costes asociados con reparaciones imprevistas. Gracias al análisis de datos históricos de sensores, es posible predecir cuándo un componente está en riesgo de fallo, permitiendo realizar un mantenimiento preventivo antes de que ocurra un problema crítico.
Este proyecto toma como base la competición de ciencia de datos de la Scania Truck Fleet presentada en el Industrial Data Science Challenge 2024 y disponible en: https://ida2024.org/industrial-challenge/. El objetivo es desarrollar un modelo predictivo que identifique de manera precisa si un componente de un camión de la flota está en riesgo de fallo, basándose en datos de sensores y otras variables relacionadas con el funcionamiento del vehículo.
Se explorarán diferentes técnicas de aprendizaje automático, desde modelos como árboles de decisión y regresión logística, a modelos más complejos como las redes neuronales y los ensembles (random forests, gradient boosting, etc.), con el fin de encontrar el enfoque más efectivo para este problema de clasificación binaria.
Objetivos
- Realizar un análisis exploratorio de los datos para identificar patrones que puedan indicar riesgos de fallo en los componentes.
- Preprocesar los datos para simplificar su tratamiento y obtener modelos de mejor calidad.
- Desarrollar modelos predictivos de mantenimiento preventivo utilizando técnicas de aprendizaje automático, incluyendo modelos basados en árboles, regresiones logísticas y ensembles.
- Evaluar el rendimiento de los modelos en términos de precisión, recall, F1-score y otras métricas relevantes para un escenario industrial de mantenimiento predictivo.
- Implementar técnicas de manejo de desbalanceo de clases, debido a la alta probabilidad de que los datos tengan una cantidad significativamente menor de fallos en comparación con los casos sin fallos.
- Desarrollar una aplicación de mantenimiento predictivo que permita visualizar los resultados y la probabilidad de fallo de cada componente en tiempo real.
- Escribir la memoria del TFG, documentando los métodos, resultados y conclusiones del estudio.
Metodología y Competencias
Metodología
- Análisis de los Datos:
- Realizar un análisis exploratorio para entender la estructura de los datos proporcionados por la competición. Identificar correlaciones entre las variables proporcionadas por los sensores y los fallos de los componentes.
- Detectar patrones de datos atípicos o ruido que puedan afectar el rendimiento de los modelos.
- Preprocesamiento de Datos:
- Realizar técnicas de limpieza de datos y normalización para garantizar que las variables estén en un rango adecuado para el entrenamiento de los modelos.
- Aplicar técnicas de ingeniería de características como la selección de variables relevantes y la creación de nuevas variables que puedan mejorar el rendimiento del modelo.
- Tratar el desbalanceo de clases utilizando métodos como sobremuestreo de la clase minoritaria (SMOTE) o submuestreo de la clase mayoritaria.
- Desarrollo de Modelos de Aprendizaje Automático:
- Implementar y entrenar diferentes tipos de modelos de clasificación binaria.
- Optimización de Modelos:
- Realizar selección de modelos mediante ajuste de hiperparámetros, utilizando técnicas como grid search o random search.
- Aplicar validación cruzada para evaluar la generalización del modelo y evitar el sobreajuste.
- Evaluación del Modelo:
- Utilizar métricas específicas para problemas de clasificación desbalanceada, como la AUC-ROC, el F1-score y la matriz de confusión, además de las métricas estándar de precisión y recall.
- Comparar los resultados obtenidos por los diferentes modelos en términos de rendimiento y eficiencia computacional.
- Desarrollo de una Aplicación:
- Implementar una aplicación de escritorio o web que permita al usuario cargar datos de sensores en tiempo real y visualizar las predicciones del riesgo de fallo de los componentes de cada camión.
- La aplicación también proporcionará un informe sobre los componentes con mayor probabilidad de fallo, recomendando acciones de mantenimiento preventivo.
- Escritura de la Memoria:
- Redactar un informe detallado que incluya la metodología seguida, los modelos implementados, los resultados obtenidos, así como las limitaciones y posibles mejoras del enfoque propuesto.
Competencias
Este proyecto desarrollará competencias clave en las siguientes áreas:
- [CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- [CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes o entornos inteligentes.
- [CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
- Herramientas de programación como Python, con librerías de aprendizaje automático como Scikit-learn, XGBoost, LightGBM y TensorFlow.
- Plataformas de visualización de datos para la creación de la aplicación final, como Streamlit o Dash.
- Computadoras con acceso a servicios de computación en la nube o hardware local para el entrenamiento de los modelos.
Bibliografía
- Libros y artículos sobre mantenimiento predictivo y machine learning aplicado a la industria.
- Manuales y documentación de librerías especializadas como XGBoost y LightGBM para modelos avanzados de boosting.
- Artículos recientes de conferencias como NeurIPS, ICML, y IEEE Conference on Prognostics and Health Management sobre aplicaciones de machine learning en mantenimiento predictivo.
Tutores GAMEZ MARTIN, JOSE ANTONIO ALFARO JIMENEZ, JUAN CARLOS | Alumno ALCARRIA LASERNA, ÓSCAR
|
| |