Exploration de Données Educatives (Educational Data Mining)

REL (OER) : « L’Exploration de Données Éducatives (Educational Data Mining) »

Cet article reprend le texte de mon cours sur l’Exploration de Données Éducatives (Educational Data Mining) pour le MOOC « Enseigner et Former avec le Numérique – Formateurs d’Adultes », proposé par l’ENS de Cachan et l’ENS de Lyon en 2014.

Nous allons définir l’Exploration de Données Éducatives et préciser ses liens avec la formation
d’adultes en six questions :

  • Qu’est-ce que l’Exploration de Données Éducatives ?
  • Quel est l’historique de cette discipline ?
  • Quels en sont les enjeux ?
  • Quels sont ses publics et ses périmètres d’application?
  • Quelles sont les méthodes utilisées ?
  • Quel est l’intérêt de l’Exploration de Données Éducatives pour un formateur d’adultes ?

L’exploration, ou la fouille, de données (dite Data Mining en anglais) est une discipline ayant pour objet :

  • l’extraction de connaissances informationnelles à partir de grandes quantités de données
  • la détermination de modèles basés sur la mise en relation des données.

Cette exploration s’effectue par des méthodes automatiques ou semi-automatiques.

L’Exploration de Données Éducatives (dite Educational Data Mining en anglais) est une discipline scientifique émergente.

Elle fait se rencontrer plusieurs disciplines, en particulier :

  • le data mining (l’exploration de données)
  • le machine learning (l’apprentissage automatique)
  • la statistique
  • les mathématiques
  • l’informatique
  • les Sciences de l’Apprendre (en anglais Learning Sciences).

L’Exploration de Données Educatives est une discipline qui repose sur les techniques de la fouille de données appliquées aux données éducatives.

L’Exploration de Données Educatives

  • identifie
  • analyse
  • développe

des méthodes et des processus pour analyser les données issues de l’éducation.
Les données analysées par l’Exploration de Données Educatives sont constituées des traces numériques laissées par les apprenants et leurs enseignants lors de :

  • leurs interactions dans des environnements d’apprentissage connectés de toutes natures (en
    particulier les plateformes de formation en ligne (dits LMS)
  • leurs consultations de ressources didactiques.

Le point de départ de l’Exploration de Données Éducatives est constitué par l’analyse des logs issus des interactions étudiants – ordinateur (un log est un fichier d’enregistrement informatique de l’historique des événements sur un dispositif numérique).

  • La mise à disposition de données éducatives étant de plus en plus fréquente et accessible a abouti à la tenue de divers ateliers thématiques entre 2000 et 2007, dans le cadre de plusieurs
    conférences scientifiques internationales.
  • En 2008, un groupe de chercheurs spécialisé dans l’Exploration de Données Éducatives a mis sur pied la première conférence scientifique internationale exclusivement consacrée à cette nouvelle discipline.
  • En 2009 est apparu le “Journal of Educational Data Mining”, une revue scientifique en ligne gratuite et en libre accès, qui fait état des dernières recherches menées en Exploration de Données Educatives.
  • En 2011, a été constitué l’International Educational Data Mining Society.

Quels sont les enjeux de l’Exploration de Données Éducatives ?

La création en institution éducative de bases de données dédiées aux informations sur les
étudiants, et l’usage croissant des logiciels éducatifs amènent à la constitution de dépôt de données éducatives de plus en plus importants.
Le développement du e-Learning, concomitant à celui d’Internet accroît davantage encore le
volume de données susceptible d’être exploré.
Ces données viennent s’additionner aux données également récoltées dans les salles de formation.

Quels sont les publics et les périmètres d’application de l’Exploration de Données Éducatives ?

Exploration de Données Educatives (Educational Data Mining)Tableau réalisé d’après l’article : ROMERO, Cristóbal et VENTURA, Sebastián. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews), 2010, vol. 40, no 6, p. 601-618.

Les méthodes utilisées par l’Exploration de Données Éducatives

Voici quelques-unes des principales méthodes utilisées par l’Exploration de Données Éducatives :

  • La prédiction : l’objectif est de développer un modèle qui peut déduire d’un seul aspect des données certaines combinaisons d’autres aspects des données.
  • Le clustering : l’objectif est de regrouper les données pour mieux les classifier.
  • L’extraction de relation : l’objectif est d’identifier des relations entre des entités sémantiques.
  • La découverte de modèles : l’objectif est d’utiliser un modèle déjà créé et de l’utiliser pour faire de nouvelles découvertes dans la science de l’apprentissage.
  • La distillation de données pour le jugement humain : l’objectif est de favoriser l’identification de données et leur classification. La datavisualisation y est particulièrement utile.

L’Exploration de Données Éducatives a pour finalité une meilleure compréhension des apprenants et de leurs conditions d’apprentissage.
Elle peut permettre :

  • de détecter et d’anticiper le désengagement des apprenants
  • de guider l’effort d’apprentissage des apprenants
  • d’évaluer les apprenants dans les tâches d’apprentissage

L’Exploration de Données Éducatives peut également permettre :

  • de développer ou d’affiner les modèles d’apprenants
  • de prévoir les performances et le comportement des apprenants
  • de mesurer les effets des interventions individuelles
  • de développer une meilleure compréhension des représentations que les apprenants ont d’une discipline.

Cc-by-nc-sa

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *