- Etincelle, 2024, Vol. 25, no. 2 .
- Publié le 06/09/2024
- DOI: 10.61532/rime252114
Sédar Paluku Mutsotsya Héritier Nsenge Mpia Manassé Nzanzu Munga Baelani Inipaivudu Nephtali Moise Katembo Kasolene
Prédiction des notes finales des étudiants en fin du premier cycle : Utilisation de Data Mining éducatif
Résumé:
L'analyse des performances académiques est basée sur un certain nombre de facteurs
qui mesurent les capacités intellectuelles. Cette mesure de la performance est basée sur un certain nombre de variables qui peuvent être utilisées pour prédire la performance académique et les notes finales. Les outils statistiques permettent avant tout de mesurer l'impact des données les unes sur les autres. À cette fin, l'étude des corrélations est le meilleur compromis pour identifier les vrais et les faux prédicteurs entre les variables. Aussi, par le biais des statistiques descriptives, la distribution des données est d'ordre important pour mesurer les différentes dispersions des données dans leur exploration, ces analyses minutieuses amènent le chercheur à devoir cibler les éléments nécessaires à la prédiction des outputs. Pour prédire les performances académiques des étudiants, il est important d'avoir une idée de l'historique de leurs études, afin de pouvoir identifier les facteurs qui peuvent être déterminants pour prédire le résultat final à la fin du cycle. Les modèles d'apprentissage automatique ont joué un rôle clé dans la prédiction des performances. Après avoir exploré les données, nous avons pu comparer les performances des différents algorithmes. Nous avons comparé six algorithmes, dont deux ont atteint une performance acceptable de 80% pour le coefficient de détermination : la régression linéaire et le SVM. L'algorithme le plus performant est la régression linéaire, étant donné que le problème abordé est basé sur la régression. La régression est un type d'algorithme souvent adapté à l'analyse quantitative où la variable cible supporte des valeurs continues. Une fois les modèles entraînés, ils ont été déployés sur la plateforme web à l'aide du Framework Python Flask, en vue de mettre les résultats à la disposition du grand public. Pour illustrer notre modèle, nous avons utilisé 6 variables susceptibles de déterminer les meilleurs prédicteurs. Une fois le modèle entraîné, il peut être utilisé et sauvegardé pour un déploiement ultérieur.
Mots clés: Performance académique, analyse quantitative, données éducatives, université de l’Assomption au Congo, Machine Learning
Télécharger le PDF