Universidad de Castilla-La Mancha
 
Escuela Superior de Ingeniería Informática

 

  cambiar a curso:   2019-20   2021-22



Grado en Ingeniería Informática


TRABAJOS FIN DE GRADO
curso: 2020-21

Estudio de la técnica de aprendizaje profundo combinado con refuerzo y su aplicación a la programación de un agente inteligente para jugar videojuegos retro.


Tecnologías Específicas

Computación
 


Descripcion y Objetivos

Desde la irrupción de las técnicas de Aprendizaje Profundo (deep learning) su éxito en la aplicación de problemas de visión y procesamiento de señal sobre todo no han dejado de marcar hitos. La definición de redes neuronales con gran cantidad de capas (de ahí la profundidad) y el uso de capas específicas (convolución, pooling, etc.), ha permitido lograr resultados antes nuca vistos. 

Los juegos no han sido ajenos a esta irrupción, más bien disrupción, tecnológica y programas como AlfaGo han marcado el hito de derrotar claramente al campeón mundial en ese momento. Además, la combinación del aprendizaje profundo con las técnicas de aprendizaje por refuerzo ha dado como resultado un nuevo paradigma conocido como "Deep Reinforcement Learning", cuyo uso en el dominio de los juegos ha revolucionado el panorama, permitiendo que agentes implementados usando está técnica aprendan a partir de 0, es decir, jugando contra sí mismos y sin integrar conocimiento a priori. Así, programas como AlfaZero (go y chess) han conseguido superar a sus predecesores, explorando líneas de juego no consideradas previamente por jugadores humanos.

En este TFG el objetivo es estudiar las técnicas de Deep-Q Learning, llamadas así por el uso del algoritmo Q-Learning para la fase de aprendizaje por refuerzo. Posteriormente se revisarán implementaciones actuales y se programará un agente para jugar vídeojuegos "retro" disponibles en la plataforma OpenAI Gym.

 

 


Metodología y Competencias

Metodología:

- Se estudiará la literatura actual y el software disponible en relación a los algoritmos de aprendizaje por refuerzo y aprendizaje profundo, así como su combinación.

- Se estudiará la plataforma OpenAI Gym, se seleccionará un subconjunto de juegos para probar los agentes implementados.

- Se diseñarán e implementarán en OpenAI Gym los agentes usando las librerías seleccionadas.

- Se realizará un estudio experimental y todo quedará documentado en la memoria del TFG.

Competencias:

Se trabajarán principalmente (en distinto grado) las siguientes competencias específicas de la tecnología de computación:

  • Capacidad para evaluar la complejidad computacional de un problema, conocer estrategias algorítmicas que puedan conducir a su resolución y recomendar, desarrollar e implementar aquella que garantice el mejor rendimiento de acuerdo con los requisitos establecidos.
  • Capacidad para conocer los fundamentos, paradigmas y técnicas propias de los sistemas
    inteligentes y analizar, diseñar y construir sistemas, servicios y aplicaciones informáticas
    que utilicen dichas técnicas en cualquier ámbito de aplicación.
  • Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una
    forma computable para la resolución de problemas mediante un sistema informático en
    cualquier ámbito de aplicación, particularmente los relacionados con aspectos de
    computación, percepción y actuación en ambientes entornos inteligentes.
  • Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e
    implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción
    automática de información y conocimiento a partir de grandes volúmenes de datos.
 


Medios a utilizar

Ordenadores personales, compiladores y entornos de programación. Todo disponible en la ESIIAB.

 


Bibliografía

Libros y manuales de inteligencia artificial y aprendizaje automático. Libros y manuales de lenguajes de programación y librerías específicas de aprendizaje automático. Todo disponible en la ESIIAB y/o en internet.

 


Tutores


GAMEZ MARTIN, JOSE ANTONIO
PUERTA CALLEJON, JOSE MIGUEL
 

Alumno


JÁTIVA JIMÉNEZ, MIGUEL-ENRIQUE

 

 

Sindicación  Sindicación  Sindicación  Sindicación

Curso: 2020-21
© Escuela Superior de Ingeniería Informática
Edificio Infante Don Juan Manuel
Avda. de España s/n
02071 Albacete

informatica.ab@uclm.es
aviso legal
generar código QR de la página