2021-01-28 Plan des séances

Voici le plan prévu pour les cinq séances du cours de machine learning pour l’économie et la finance.

Séance 1

Séance 2

Séance 3

Séance 4

  • Webscrapping
    • JSON, xml

    • Clustering

    • Traitement du texte

    • Catégories (encoding, dirtycat)

  • Texte libre, (tokenisation, encoder, tf-idf, deep learning)

Séance 5

  • Pipeline scikit-learn
    • Étendre scikit-learn avec ses propres modèles

    • Créer un module python

    • Test unitaires

  • Interprétabilité des modèles
    • Modèles éthiques

  • Machine learning crypté

  • Survival analysis

Un peu plus de détails sur la séance 1

Projet de machine learning
  • Récupérer les données –> dataframe (pandas.read_csv(« … », sep= »; »))

  • Features = X + cible y : objectif prédire y

  • Séparer entre données apprentissage (train) et données test (test)

  • Estimer le modèle sur la base train

  • Evaluer sur la base test

  • Validation croisée pour vérifier la robustesse du modèle

  • La classification multiclasse est construire à partir de classifications binaires selon deux stratégies : une contre toute (One Versus Rest) ou les unes contre les autres (One Versus One)

Un peu plus en détail :

  • Courbe ROC

  • Pour la régression Lasso est utilisée pour sélectionner les variables en annulant les coefficients : Lasso.

Un peu plus de détails sur la séance 2

Un peu plus de détails sur la séance 3

Les données du jour : Chiffres-clés concernant l’épidémie de COVID19 en France.

Un peu plus de détails sur la séance 4

Covid ?

scraping

API REST

Catégories

Texte libre

topics

devinette

Un chalutier mesure la taille de tous les poissons pris. Comment estimer la proportion de mâles et femelles sachant qu’ils n’ont en moyenne pas la même taille ?

Un peu plus de détails sur la séance 5

scikit-learn API

Construire un modèle qui effectue une rotation des features avant un arbre de décision, voir API de sciki-learn et modèles customisés, FunctionTransformer.

Analyse de survie

Analyse de survie

Interprétabilité (voir Interpretable Machine Learning)

Ethique