Las técnicas tradicionales de
visualización de bases de datos requieren la selección de 1, 2 ó 3 variables a
lo sumo para su correcta proyección en un soporte bi-dimensional. Sin embargo,
al trabajar con bases de datos de alta dimensionalidad con cientos o miles de
variables; o masivas, con miles de registros, las técnicas tradicionales no son
útiles para representar bien la información.
En la literatura podemos
encontrar propuestas de diferentes técnicas de visualización que no requieren
selección previa de atributos y ni registros, sino que son capaces de
representar en 2 dimensiones toda la información contenida en la base de datos.
Se propone implementar una de estas técnicas, TableLens, en la herramienta
Weka.
Weka es una de las herramientas
gratuitas más utilizadas por la comunidad científica para la realizar tareas de
minería de datos o, en general, descubrimiento del conocimiento. Una de las
funciones que proporciona Weka es la de visualización de la base de datos
cargada; sin embargo, esta visualización consiste simplemente en un diagrama de
dispersión bi-dimensional. Se considera que la implementación de TableLens será
de gran interés para el amplísimo espectro de usuarios de Weka.
Tareas del alumno:
1. Familiarizarse
con el entorno gráfico de Weka.
2. Familiarizarse
con el la librería de programación Weka.
3. Estudiar
el estado del arte sobre técnicas de visualización.
4. Implementar
TableLens para su incorporación a Weka.