2022-03-29 Année 2022, projet

Projet : caler un modèle prédictif

  • Le choix des données est libre. Il faut néanmoins que la base de données soit suffisante, plus de 1000 observations, plus de 20 variables.

  • Le modèle prédictif devra être implémenté sous la forme d’un seul pipeline scikit-learn, depuis les données brutes jusqu’à la prédiction.

  • Il faudra construire le modèle utilisant le moins de variables possibles, via un processus de sélection de variables et expliquer pourquoi avoir choisi ce jeu de variables.

  • Il faudra comparer sur quelques observations les différences entre le modèle utilisant toutes les variables et le modèle utilisant une partie seulement (analyse d’erreur).

  • Le projet pourra être rendu sous la forme d’un notebook ou d’un programme accompagné d’un rapport avec les résultats.