Fouille de données, réseau de neurones, MOOC

Étude Exploratoire pour la Caractérisation des Raisonnements des Étudiants dans la Résolution de Problèmes en Mathématique et en Informatique.

Le sujet consiste à appliquer des algorithmes de fouille de données (data mining), pour la classification et l’analyse de corpus de question-réponse à des évaluations en fin de formation. Notre objectif est d’identifier des groupes d’étudiants adoptant les mêmes raisonnements afin de pouvoir leur proposer une aide appropriée (remédiation) si nécessaire. Ces raisonnements — corrects ou erronés— donnent lieu à des réponses d’étudiants dont on peut analyser la cohérence et extraire des règles d’association permettant de modéliser le comportement des étudiants. La classification des étudiants en groupes de comportements similaires permettra d’estimer les erreurs les plus fréquentes et la logique cognitive qui y conduit.

Travail à réaliser
1) Se familiariser avec des outils classiques utilisés en analyse de données comme R et Weka. Ces outils permettront de tester des algorithmes de classification et d’extraction de règles (k-means, arbres de décisions …)

2) Analyser le corpus à étudier comportant 400 évaluations de manière à identifier une structure de données et des variables adaptées aux objectifs de l’étude.

3) réaliser l’extraction des règles d’association et la classification des étudiants

À moyen terme, nous visons la mise en œuvre de ces méthodes sur de grandes quantités de données (Big Data) dans les MOOC (Massive Online Open Courses) et autres dispositifs techniques permettant l’apprentissage à distance.

Début du stage : dès que possible.
Prérequis : capacités d'autoformation et d'abstraction
Niveau : M2
Pour candidater, envoyez un CV, lettre de motivation et relevé de notes à marilyne.rosselle@u-picardie.fr

--

Equipe: 
Sujet: