La contaminación por compuestos orgánicos conocidos como emergentes es un problema que afecta a los ecosistemas y la salud humana. La variedad de compuestos químicos orgánicos que pueden aparecer en las aguas es muy amplia. Este hecho hace necesario el desarrollo de herramientas informáticas que ayuden a organizar y presentar los resultados analíticos de cara a obtener información útil para la gestión de los recursos hídricos.
En este trabajo de fin de grado se pretende diseñar una herramienta para la adquisición, almacenamiento, visualización y análisis de datos de compuestos orgánicos que aparecen en muestras de agua subterránea y superficial procedentes de una reserva natural, la Laguna de Pétrola.
Las muestras de agua se han analizado mediante el cromatógrafo de gases 7890B y detector selectivo de masas Agilent Serie 5977A (GC/MSD) en el Laboratorio de Biotecnología y RRNN del IDR-UCLM. Estos sistemas generan unos resultados en formato Excel, y que constan de las siguientes variables: punto de muestreo, nombre del compuesto según dos bases de datos (una adquirida a Agilent, enfocada a 926 contaminantes, y otra denominada NIST, que es una base de datos de referencia), el tiempo de retención (RT) en el cromatógrafo, y el tiempo de retención que viene en la librería de Agilent, si aparece ahí el compuesto. Además, aparece un match factor, que es la veracidad de la identificación del compuesto, la fórmula molecular y su número CAS.
A grandes rasgos, el desarrollo del trabajo consiste en el diseño de una base de datos estructurada orientada al análisis, de un proceso ETL que permita incorporar la información de los archivos Excel a la base de datos, y dun visualizador que permita llevar a cabo consultas contra la base de datos estructurada. Estas consultas no solo serán descriptivas, sino que se incluirá la posibilidad de llevar a cabo test estadísticos, o incluso de aplicar modelos de aprendizaje automático.
Este trabajo consiste en varias etapas diferenciadas:
- Estudio de los datos
- Definición de la base de datos estructurada
- Diseño y desarrollo de un procedimiento ETL para la lectura de archivos y almacenamiento en la base de datos.
- Pre-análisis de los datos y definición de objetivos de análisis y visualización
- Elaboración de un cuadro de mando para la visualización
- Despliegue del cuadro de mando
- Prueba de la herramienta: Análisis inicial de la información.
Por otra parte, el proyecto trabaja las siguientes competencias de la intensificación de computación del Grado en Ingeniería Informática.
[CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
[CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas medianteun sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes o entornos inteligentes.
[CM6] Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
[CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.