Lectures#
Le machine learning répond à de plus en plus de problématiques, beaucoup d’entre elles sont citées sur ce cours Python pour un Data Scientist / Economiste proposé à l”ENSAE qui comprend des exercices, des articles et les modules qui implémentent quelques algorithmes. Quelques thèmes liés au machine learning seront abordés en partant d’un jeu de données pour explorer quelques points récurrents ou techniques.
- Classification et régression
- Comprendre un modèle
- Prétraitement des données, données textuelles
- Pipeline de traitement de données
- Valeurs manquantes, problèmes déséquilibrés, overfitting
- Machine Learning non supervisé
- Quelques autres problèmes de machine learning
- Gradient et méthodes ensemblistes
- Séries temporelles
- Images et deep learning
- Cartes
Le machine learning cache bien des choses mais au final il s’agit de calculer une prédiction pour un événement jamais observé. Ces techniques synthétisent les observations passées pour en déduire une réponse probable sur des observations futures. Le nuage de points suivant représente ce qui a été observé jusqu’à présent.

Le machine learning propose une façon de construire
une fonction qui résume ou modèlise les observations passées.
Le résultat obtenu fait en quelque sorte une synthèse du passé pour
inférer une réponse probable à des événements
jamais observés. Dans le cas du nuage de point précédent,
on souhaite calculer une prédiction y pour
un x différent. Le machine learning prolonge un savoir
fait de résultat d’expérience. Autrement dit, le modèle de
machine learning pourra retourner une prédiction pour l’intervalle
alors que nous ne connaissons
la réponse qu’aux extrémités de cet intervalle.
