Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2022-23   2024-25



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2023-24

Estructuración y análisis de información publicada en prensa web mediante chatGPT


Tecnologías Específicas

Computación
 


Descripcion y Objetivos

La gran novedad tecnológica y social de este último año ha sido la irrupción de herramientas de IA generativa. Una de ellas, chatGPT, es sin duda la más conocida debido principalmente a su capacidad, que va más allá de la simple generación de texto, y que permite entre otras cosas resumir, analizar, dar formato a textos existentes. Además, algunas herramientas vinculadas a esta extienden su capacidad para tareas como la generación de gráficos, de código, o la analítica de datos.

Por otra parte, debido a la situación política en España, la información con respecto a algunos hechos que se publica en distintos los medios puede tener orientaciones distintas, o incluso antagónicas.

El objetivo de este trabajo es recopilar artículos de prensa (web) relativos a una temática, y aprovechar la funcionalidad de chatGPT para clasificarlos, caracterizarlos, y organizarlos con el fin de analizar cómo se publica la información. Para ello se recurrirá a herramientas de webscraping, a la API de OPENAI (que permite llamar a chatGPT desde el código) y a otro tipo de herramientas como Obsidian para crear un banco de información.

 


Metodología y Competencias

En la elaboración del proyecto se seguirán los siguientes pasos, en este orden:

  • Identificación de una temática (ha de ser del interés del alumno). Identificación de fuentes de datos.
  • Estudio de la herramienta selenium y del proceso de webscraping
  • Estudio de chatGPT y de la API de openAI
  • Descarga y caracterización de textos
  • Construcción automática de una estructura de datos en markdown con la sintaxis de obsidian
  • Análisis y visualización de la información

Por otra parte, el proyecto trabaja las siguientes competencias de la intensificación de computación:

  • [CM3] Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
  • [CM5] Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas medianteun sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes o entornos inteligentes.
  • [CM6] Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
  • [CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
 


Medios a utilizar

Un PC, el lenguaje de programación Python y las librerías correspondientes. 

Acceso a la API de OpenAI: Se calcula un gasto total de unos 20 euros. El alumno debe abrirse una cuenta y es responsable de los pagos. 

 


Bibliografía

  • Manuales del lenguaje Python: https://docs.python.org/3/tutorial/
  • Documentación de la herramienta selenium: https://www.selenium.dev/
  • Documentación de la API de OpenAI: https://openai.com/product
  • Documentación de la herramienta obsidian: https://obsidian.md/
 


Tutor


OSSA JIMENEZ, LUIS DE LA
 

Alumno


MARÍN MARTÍNEZ, ANTONIO
 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2023-24
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete

informatica.ab@uclm.es
aviso legal
generar código QR de la página