En función de la locaclización geográfica, la diabetes tipo II tiene una prevalencia de entre el 4 y el 20%. La diabetes se asocia a un amplio abanico de complicaciones, que van desde problemas de corazón a la ceguera o problemas renales. La predicción de qué paciente tiene diabetes es un problema de interés.
En este proyecto/trabajo el objetivo es elaborar modelos de predicción a partir de una base de datos con unos 10000 pacientes cuyo estado (enfermo o no-enfermo) está etiquetado. Se contará con otra base de datos alternativa (<4000 pacientes) para evaluar la bondad de los modelos.
Habrá una fase inicial de construcción de la vista minable a partir de las bases de datos, y se probarán/implementarán algoritmos de selección de características, clasificación, combinación, etc.
Se usará el API de weka (java) como plataforma base para implementar los algoritmos.