Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2023-24   2025-26



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2024-25

Herramienta para la adquisición, almacenamiento y análisis de datos de compuestos orgánicos en muestras de agua.


Tecnologías Específicas

Computación
 


Descripcion y Objetivos

La contaminación por compuestos orgánicos conocidos como emergentes es un problema que afecta a los ecosistemas y la salud humana. La variedad de compuestos químicos orgánicos que pueden aparecer en las aguas es muy amplia. Este hecho hace necesario el desarrollo de herramientas informáticas que ayuden a organizar y presentar los resultados analíticos de cara a obtener información útil para la gestión de los recursos hídricos. 

En este trabajo de fin de grado se pretende diseñar una herramienta para la adquisición, almacenamiento, visualización y análisis de datos de compuestos orgánicos que aparecen en muestras de agua subterránea y superficial procedentes de una reserva natural, la Laguna de Pétrola. 

Las muestras de agua se han analizado mediante el cromatógrafo de gases 7890B y detector selectivo de masas Agilent Serie 5977A (GC/MSD) en el Laboratorio de Biotecnología y RRNN del IDR-UCLM. Estos sistemas generan unos resultados en formato Excel, y que constan de las siguientes variables: punto de muestreo, nombre del compuesto según dos bases de datos (una adquirida a Agilent, enfocada a 926 contaminantes, y otra denominada NIST, que es una base de datos de referencia), el tiempo de retención (RT) en el cromatógrafo, y el tiempo de retención que viene en la librería de Agilent, si aparece ahí el compuesto. Además, aparece un match factor, que es la veracidad de la identificación del compuesto, la fórmula molecular y su número CAS.

A grandes rasgos, el desarrollo del trabajo consiste en el diseño de una base de datos estructurada orientada al análisis, de un proceso ETL que permita incorporar la información de los archivos Excel a la base de datos, y dun visualizador que permita llevar a cabo consultas contra la base de datos estructurada. Estas consultas no solo serán descriptivas, sino que se incluirá la posibilidad de llevar a cabo test estadísticos, o incluso de aplicar modelos de aprendizaje automático.

 

 


Metodología y Competencias

Este trabajo consiste en varias etapas diferenciadas:

  • Estudio de los datos
  • Definición de la base de datos estructurada
  • Diseño y desarrollo de un procedimiento ETL para la lectura de archivos y almacenamiento en la base de datos.
  • Pre-análisis de los datos y definición de objetivos de análisis y visualización
  • Elaboración de un cuadro de mando para la visualización
  • Despliegue del cuadro de mando
  • Prueba de la herramienta: Análisis inicial de la información.

Por otra parte, el proyecto trabaja las siguientes competencias de la intensificación de computación del Grado en Ingeniería Informática.

[CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
[CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas medianteun sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes o entornos inteligentes.
[CM6] Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
[CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.

 


Medios a utilizar

Un PC, el lenguaje de programación python y el stack de librerías para analítica de datos, visualización y machine learning.

 


Bibliografía

  • Manuales del lenguaje Python: https://docs.python.org/3/tutorial/
  • Manual de la librería Pandas: https://pandas.pydata.org/
  • Manual de la librería Seaborn: https://seaborn.pydata.org/
  • Manual de la librería Numpy: https://numpy.org/doc/stable/user/tutorials_index.html
  • Manual de librería scikit-learn: https://scikit-learn.org/stable/
  • Documentación de Plotly Dash: https://dash.plotly.com/
 


Tutores


OSSA JIMENEZ, LUIS DE LA
GÓMEZ ALDAY, JUAN JOSÉ
 

Alumno


LÓPEZ LORENZO, DAVID

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2024-25
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete

informatica.ab@uclm.es
aviso legal
generar código QR de la página