.. blogpost:: :title: Plan séance 5 :keywords: plan :date: 2022-02-25 :categories: session Voici le plan prévu pour la première séance du cours de machine learning pour l'économie et la finance. **Séance 5 - partie 1** * json, rest, javascript * `analyse de survie `_ **Séance 5 - partie 2** * interprétabilité, `LIME `_, `Shapeley `_, `Counter Factual `_, `Partial Dependence `_ * biais en machine learning * `machine learning éthique `_ * le projet, un modèle, analyser trois observations mal prédites, utiliser un des outils pour interpréter, en déduire une explication, suggérer une amélioration du modèle ou des variables pour corriger ces erreurs *A propros des biais* * `Calibration for the (Computationally-Identifiable) Masses `_ * `Outcome Indistinguishability `_ * `L'équité de l'apprentissage machine en assurance `_ * `Machine Learning éthique `_ * `Interprétabilité des modèles `_ Extraits : * Les biais de type 1 sont liés à des classes qui ne reflèteraient pas la réalité du risque, mais seraient motivés par de purs préjugés (critique qui ne remet pas en question le principe du bien-fondé de la classification). Justifiée en amont par le mythe d'une causalité des signes astrologiques sur les accidents par exemple, une classification zodiacale se révèlerait à l'usage comme « biaisée », au sens trivial où le modèle est faux ; * Les biais de type 2 sont liés à des classes qui reflètent une réalité statistique avérée (une corrélation avec le risque, donc un modèle exact) mais non causale, ce qui rend leur usage suspect d'un parti-pris et d'un choix arbitraire. C'est le cas par exemple du paramètre homme/femme. Là aussi on admet le bien-fondé d'une classification qui s'appuierait uniquement sur des variables causales, mais la corrélation seule ne donne pas lieu à une explication acceptable ; * Les biais de types 3 sont liés à des classes qui reflètent une réalité statistique et causale, mais qui est elle-même le fait de discriminations sociales en amont. Dans ce cas, le modèle est exact mais la classification est intrinsèquement nuisible car elle reproduit et ancre dans la réalité une situation contre laquelle il faut lutter. A propos du biais de type 1, il apparaît également lorsqu'une nomenclature n'évolue pas et ne reflète plus les données d'aujourd'hui. L'indice des prix est une statistique dont le sens ne change pas mais dont la pondération change : `Pour comprendre l'indice des prix `_. *Machine Learning privé* * `Calibrating Noise to Sensitivity in Private Data Analysis `_ * `The Algorithmic Foundations of Differential Privacy `_ *Projets*