Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2023-24   2025-26



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2024-25

Desarrollo de un chatbot inteligente ESIICHAT mediante tecnología RAG


Tecnologías Específicas

Computación
 


Descripcion y Objetivos

Introducción

En el contexto educativo universitario, la disponibilidad de información clara y accesible para los estudiantes es clave para una buena experiencia académica. Sin embargo, la diversidad de procesos y la complejidad de los planes de estudio pueden generar dudas frecuentes que requieren atención constante por parte del personal administrativo. Un chatbot inteligente basado en tecnología RAG (Retrieval-Augmented Generation) puede proporcionar respuestas rápidas y precisas a las preguntas más comunes de los estudiantes, mejorando la eficiencia en la comunicación y aliviando la carga administrativa.

La tecnología RAG permite combinar la generación de lenguaje natural (LLM) con la recuperación de información específica de fuentes locales. En este caso, las fuentes incluirán datos y documentos locales de la Escuela Universitaria de Ingeniería Informática (ESII), como el plan de estudios, guías académicas, normativas y procesos internos.

Objetivos

  1. Desarrollar un chatbot inteligente que pueda responder automáticamente a preguntas relacionadas con los planes de estudio y procesos de la Escuela Universitaria de Ingeniería Informática (ESII).
  2. Implementar una solución basada en tecnología RAG para garantizar que las respuestas del chatbot estén basadas en información actualizada y local del centro.
  3. Evaluar la efectividad del chatbot en términos de precisión y utilidad a través de pruebas con estudiantes y personal de la ESII.
 


Metodología y Competencias

Metodología

Diseño del Sistema

El proyecto estará basado en la implementación de un modelo de Retrieval-Augmented Generation (RAG), que combinará el uso de un LLM (Modelo de Lenguaje Extenso) con un sistema de recuperación de información de fuentes locales.

  1. Recuperación de Información:

    • Se integrará un sistema de búsqueda basado en una base de datos local que contenga la documentación relevante de la ESII: planes de estudio, normativas, procesos administrativos, etc.
    • Para la implementación, se podría usar herramientas como Elasticsearch o Haystack, que faciliten la indexación y recuperación de documentos.
  2. Generación de Respuestas:

    • Se utilizará un LLM (por ejemplo, GPT) para generar respuestas naturales a las preguntas planteadas, enriqueciendo las respuestas con la información recuperada del sistema de búsqueda.
  3. Integración y Desarrollo del Chatbot:

    • El chatbot estará disponible a través de una interfaz amigable para los estudiantes, ya sea como una aplicación web, en plataformas de mensajería o en la web del centro.
    • Se integrarán API’s de LLM para el procesamiento de lenguaje natural, junto con la tecnología RAG para asegurar que las respuestas estén contextualizadas con la información local.

Recolección de Datos

  • Se recopilarán los documentos clave del centro, como el plan de estudios, reglamentos académicos, normativas de prácticas, asignación de tutorías, procesos de matrícula, y cualquier otro material relevante.
  • Los datos serán estructurados e indexados para una recuperación eficiente por parte del sistema de búsqueda.

Análisis y Desarrollo

  1. Entrenamiento y Ajuste del Modelo: Aunque el LLM ya estará preentrenado, se realizará un ajuste fino para las respuestas específicas del centro universitario, asegurando que las respuestas sean contextualizadas.
  2. Evaluación del Chatbot: Se realizarán pruebas con estudiantes y personal del centro para medir la precisión y la utilidad del chatbot. Los resultados de estas interacciones se utilizarán para mejorar iterativamente el sistema.

Competencias

[CM1] Capacidad para tener un conocimiento profundo de los principios fundamentales y modelos de la computación y saberlos aplicar para interpretar, seleccionar, valorar, modelar, y crear nuevos conceptos, teorías, usos y desarrollos tecnológicos relacionados con la informática.
[CM4] Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas que utilicen dichas técnicas en cualquier ámbito de aplicación.
[CM6] Capacidad para desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona computadora.
[CM7] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
 

 


Medios a utilizar

  • Hardware: Computadoras con capacidad suficiente para ejecutar el sistema de búsqueda y el modelo de lenguaje (servidor local o soluciones en la nube como AWS o Google Cloud).
  • Software:
    • Lenguajes de programación como Python para la implementación del sistema.
    • Frameworks como Haystack o Elasticsearch para la recuperación de información.
    • API de OpenAI o similares para el uso del LLM.
  • Recursos Locales: Documentación interna de la ESII para ser indexada y utilizada como fuente de información.
 


Bibliografía

  • Lewis, P., et al. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. In NeurIPS 2020.
  • Brown, T. et al. (2020). Language Models are Few-Shot Learners. In NeurIPS 2020.
  • Haystack Documentation (https://haystack.deepset.ai/)
 


Tutores


GAMEZ MARTIN, JOSE ANTONIO
PUERTA CALLEJON, JOSE MIGUEL
 

Alumno


COPETE GONZÁLEZ, ALEJANDRO

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2024-25
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete

informatica.ab@uclm.es
aviso legal
generar código QR de la página