Se considera como dato educativo todo aquel que surge como resultado de un proceso educativo, que viene de un sistema educativo o ambiente académico, reconociendo que existen tanto ambientes académicos tradicionales como otros no tradicionales. La minería de datos educativos puede ser aplicada sobre los datos provenientes de estos dos tipos de sistemas educativos (Romero & Ventura, 2013). Así mismo, la granularidad y cantidad que pueden alcanzar este tipo de datos está relacionada y se asocia también con el ambiente educativo particular en el que se producen.
Una taxonomía es un sistema de clasificación jerárquica que se utiliza para organizar y categorizar los datos según su naturaleza y características. Una taxonomía de datos educativos puede ser de gran ayuda en la representación del conocimiento de dominio específico (Lu et al., 2019). En el contexto de la minería de datos educativos, una taxonomía puede ayudar a definir las variables e indicadores de interés de manera clara y coherente, lo que a su vez facilita la selección y aplicación de las técnicas de minería de datos adecuadas para el análisis. Además, puede ayudar a identificar las relaciones y patrones entre los datos, lo que a su vez puede conducir a una mejor comprensión y descripción del conocimiento del dominio.
Por ejemplo, una taxonomía de datos educativos puede clasificar los datos según el tipo de estudiante (género, edad, nivel de estudios), tipo de escuela (pública o privada), el tipo de curso (matemáticas, ciencias, idiomas) y otros factores relevantes del dominio de la educación. Al clasificar los datos de esta manera, se pueden identificar patrones y relaciones entre los diferentes tipos de datos, lo que a su vez puede ayudar a desarrollar modelos de predicción y clasificación más precisos.
Una taxonomía dado es un instrumento que permite la clasificación de los conocimientos por medio de una forma arbórea donde los términos más generales se ubican en la raíz y los términos más específicos en las ramas y hojas. La taxonomía facilita establecer un sistema para clasificar la especificidad de los datos en la medida que se recorre la estructura del árbol, mostrando las categorías de datos de interés y las relaciones entre estos.
Se presenta, a continuación, la propuesta de una taxonomía para datos provenientes de educación básica y media en Colombia.
Taxonomía para datos de educación básica y media en Colombia