.. |pyecopng| image:: _static/pyeco.png :height: 20 :alt: Economie :target: http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx/td_2a_notions.html#pour-un-profil-plutot-economiste .. |pystatpng| image:: _static/pystat.png :height: 20 :alt: Statistique :target: http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx/td_2a_notions.html#pour-un-profil-plutot-data-scientist .. _l-td2a-notions: ============================================== Les notions qu'il faut avoir comprises ou vues ============================================== .. contents:: :local: Pour un profil plutôt économiste ++++++++++++++++++++++++++++++++ |pyecopng| *Ce qu'il faut maîtriser* * Les bases du langage :epkg:`Python` : boucles, tests, fonctions, listes, dictionnaires, modules, expressions régulières. * Le calcul matriciel, les dataframes, les graphes, les cartes. * Les valeurs manquantes. * Le langage SQL. * La transformation des données textuelles. * Quelques projections (ACP), la normalisation, le clustering. * Les problèmes classiques de machine learning (classification, régression, ranking, recommandation, séries temporelles). * Scraping. *Ce qu'il faut connaître* * Quelques solutions pour de gros volumes de données. * Les graphes en javascript. * La création d'un site web avec Django ou Flask. * Machine learning éthique. * Transfer Learning. * Optimisation des hyperparamètres. * Accélération de code type numba, cython. Pour un profil plutôt data scientist ++++++++++++++++++++++++++++++++++++ |pystatpng| *Ce qu'il faut maîtriser* * Les bases du langages : boucles, tests, fonctions, listes, dictionnaires, modules, expressions régulières, classes. * Le calcul matriciel, les dataframes, les graphes, les cartes, valeurs manquantes. * La notion d'itérateurs pour le traitement de gros volumes de données. * La parallélisation. * Le langage SQL. * La transformation des données textuelles, les projections (ACP, t-SNE), la normalisation, notions d'embeddings (texte, images, deep learning), de pipelines. * Le clustering. * Les problèmes classiques de machine learning (classification, régression, ranking, recommandation, séries temporelles). * Optimisation des hyperparamètres. * Transfer learning, autoencoders * Scraping. *Ce qu'il faut connaître* * Deep learning, quelques problèmes résolus, Kaggle. * Reinforcement learning, * Algorithmes de streaming. * Machine learning sur des données cryptées. * Les tests unitaires. * `Git `_. * Des exercices de type `Google Jam `_. * Des accélérations du langage comme Cython, C++, numba. * Créer un site web avec Flask, Javacript.