.. _enonce2017rst: ========================================== Evaluation Python année 2016-2017 - énoncé ========================================== .. only:: html **Links:** :download:`notebook `, :downloadlink:`html `, :download:`PDF `, :download:`python `, :downloadlink:`slides `, :githublink:`GitHub|_doc/notebooks/examen/enonce_2017.ipynb|*` Le répertoire `data `__ contient deux fichiers csv simulés aléatoirement dont il faudra se servir pour répondre aux 10 questions qui suivent. Chaque question vaut deux points. Le travail est à rendre pour le lundi 20 février sous la forme d’un notebook envoyé en pièce jointe d’un mail. 1 - Deux fichiers sont extraits de la base de données d’un médecin. Un fichier contient des informations sur des personnes, un autre sur les rendez-vous pris par ces personnes. Quels sont-ils ? 2 - On souhaite étudier la relation entre le prix moyen payé par une personne, son âge et son genre. Calculer le prix moyen payé par une personne ? 3 - Faire la jointure entre les deux tables. 4 - Tracer deux nuages de points (age, prix moyen) et (genre, prix moyen) ? 5 - Calculer les coefficients de la régression :math:`prix\_moyen \sim age + genre`. 6 - On souhaite étudier le prix d’une consultation en fonction du jour de la semaine. Ajouter une colonne dans la table de votre choix avec le jour de la semaine. 7 - Créer un graphe moustache qui permet de vérifier cette hypothèse. 8 - Ajouter une colonne dans la table de votre choix qui contient 365 si c’est le premier rendez-vous, le nombre de jour écoulés depuis le précédent rendez-vous. On appelle cette colonne :math:`delay`. On ajoute également la colonne :math:`1/delay`. 9 - Calculer les coefficients de la régression :math:`prix \sim age + genre + delay + 1/delay + jour\_semaine`. 10 -- Comment comparer ce modèle avec le précédent ? Implémentez le calcul qui vous permet de répondre à cette question.