|
Grado en Ingeniería Informática |
TRABAJOS FIN DE GRADO curso: 2023-24
Estructuración y análisis de información publicada en prensa web mediante chatGPT |
Tecnologías Específicas
Computación
Descripcion y Objetivos
La gran novedad tecnológica y social de este último año ha sido la irrupción de herramientas de IA generativa. Una de ellas, chatGPT, es sin duda la más conocida debido principalmente a su capacidad, que va más allá de la simple generación de texto, y que permite entre otras cosas resumir, analizar, dar formato a textos existentes. Además, algunas herramientas vinculadas a esta extienden su capacidad para tareas como la generación de gráficos, de código, o la analítica de datos.
Por otra parte, debido a la situación política en España, la información con respecto a algunos hechos que se publica en distintos los medios puede tener orientaciones distintas, o incluso antagónicas.
El objetivo de este trabajo es recopilar artículos de prensa (web) relativos a una temática, y aprovechar la funcionalidad de chatGPT para clasificarlos, caracterizarlos, y organizarlos con el fin de analizar cómo se publica la información. Para ello se recurrirá a herramientas de webscraping, a la API de OPENAI (que permite llamar a chatGPT desde el código) y a otro tipo de herramientas como Obsidian para crear un banco de información.
Metodología y Competencias
En la elaboración del proyecto se seguirán los siguientes pasos, en este orden:
- Identificación de una temática (ha de ser del interés del alumno). Identificación de fuentes de datos.
- Estudio de la herramienta selenium y del proceso de webscraping
- Estudio de chatGPT y de la API de openAI
- Descarga y caracterización de textos
- Construcción automática de una estructura de datos en markdown con la sintaxis de obsidian
- Análisis y visualización de la información
Por otra parte, el proyecto trabaja las siguientes competencias de la intensificación de computación:
- [CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
- [CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas medianteun sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes o entornos inteligentes.
- [CM6] Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
- [CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Medios a utilizar
Un PC, el lenguaje de programación Python y las librerías correspondientes.
Acceso a la API de OpenAI: Se calcula un gasto total de unos 20 euros. El alumno debe abrirse una cuenta y es responsable de los pagos.
Bibliografía
- Manuales del lenguaje Python: https://docs.python.org/3/tutorial/
- Documentación de la herramienta selenium: https://www.selenium.dev/
- Documentación de la API de OpenAI: https://openai.com/product
- Documentación de la herramienta obsidian: https://obsidian.md/
Tutor OSSA JIMENEZ, LUIS DE LA | Alumno MARÍN MARTÍNEZ, ANTONIO |
| |