XD blog

blog page

2017-11


2017-11-11 Hackaton ENSAE : 3ème édition

J'en dirais plus bientôt mais ces deux articles devraient vous mettre sur la voie : Emmaüs se lance dans le e-commerce solidaire, Label-emmaus.co veut être un « Leboncoin solidaire ». Le troisième hackathon de l'ENSAE aura lieu les 24 et 25 novembre. Il proposera trois sujets, un sujet deep learning, un machine learning, un dernier créatif, plus économique que les années précédentes. Trois sujets inspirés des problématiques rencontrées par Label Emmaüs qui a accepté de contribuer à l'événement. Ernst & Young sponsorise à nouveau l'événement, côté étudiants, Genius contribue de nouveau à l'organisation. En attendant les prochaines informations, il faudra vous contenter du résumé des deux précédentes éditions : Hackathon Microsoft / ENSAE / Croix-Rouge / DataForGood - 2015, Hackathon Ernst & Young / ENSAE / Croix-Rouge / Crésus - 2016.

2017-11-09 2 points de QI en moins par rapport à 1990

Ce documentaire Demain tous crétins expose des résultats assez inquiétants. Un enfant sur 68 présente des symptômes autistiques en Californie, d'autres montrent des retard de croissance. La cause est le manque d'iode des femmes enceinte au début de la grossesse, ou plutôt l'augmentation de mollécules que la thyroïde confond avec l'iode comme les PCB, le chlore, les retardeurs de flammes, les pesticides. Une étude menée en Californie menée sur 17 ans, une autre sur les soldats finlandais ont réussi à montrer une baisse inquiétante du QI depuis les années 1990. Bref, il est conseillé de saturer sa thyroïde d'iode. Le sel de guérande est une option à condition qu'il soit chauffé au soleil et de n'ajouter le sel qu'en fin de cuisson. Pour vous protéger : Demain, tous crétins ?, le livre Cocktail toxique, une émission sur France Inter : Demain tous crétins : le danger des perturbateurs endocriniens.

2017-11-05 streaming pandas dataframe

pandas is widely used by data scientists. It is one of the modules which contributed a lot to the Python ecosystem to manipulate data. It is not perfect, a dataset takes in memory three times the space it takes on disk in average and reading a couple of gigabytes is necessarily fast. However, a couple of gigabytes is not enough to think about stronger approaches such parallelization (dask, ...) but with a little bit of overhead for such size. All I wanted was the same functionalities as pandas but implemented in a streaming way. No need to load the whole datasets in memory, no need to wait for the data to be fully loaded in memory. That's why I started pandas_streaming.

import pandas
df = pandas.DataFrame([dict(cf=0, cint=0, cstr="0"),
                       dict(cf=1, cint=1, cstr="1"),
                       dict(cf=3, cint=3, cstr="3")])

from pandas_streaming.df import StreamingDataFrame
sdf = StreamingDataFrame.read_df(df)

for df in sdf:
    # process this chunk of data
    # df is a dataframe
    print(df)

The module will continue to grow probably not as fast as I would like it to.

2017-11-02 Le monde numérique quand on a perdu son mot de passe

Ma mémoire m'a joué des tours à l'étranger. J'ai une mémoire plutôt visuelle, je ne connais pas mon code de carte bleue mais l'enchaînement des touches mémorisés sur la plupart des claviers de distributeurs de cartes bleues ou de machine. A 14h, je règle un dernier achat avec ma carte bleue avant de prendre le train pour la Hollande où je me retrouve dans un taxi à 8h du soir à payer en carte bleue sur un clavier qui me perturbe. Impossible de me souvenir du code. J'essaye deux fois et j'échoue. Plus qu'un essai. Je passe la nuit en essayant de me visualiser en train de taper mon code à Paris. Rien n'y fait. J'ai deux codes en tête et plus qu'un essai. Malheureusement, l'endroit où je dois me rendre est à 8km à pieds de mon hôtel. Je me réveille avec 8 euros en poche et une chance sur deux d'aller en taxi. Ca n'a pas loupé. Je me suis tapé 8 km à pied en 1h30, avec quelques détours, sur les pistes cyclables néerlandaises. A l'accueil de l'hôtel, je demande comment on peut se rendre à pied dans la ville d'à côté. Petit rire de l'hôtesse, ma question est absurde. Je lui demande jusqu'où je peux aller avec 8 euros, elle n'en a aucune idée, elle vient en voiture. Me voilà parti avec mon sac à dos et une heure et demi avant d'arriver faire un speech de 20 minutes devant 400 personnes. Un brin stressant. Le soir, j'appelle le numéro de secours de ma banque pour tenter de débloquer ma carte bleue. Je tombe sur une femme adorable qui m'explique que je peux débloquer ma carte dans un distributeur de la banque, à Paris donc, c'est-à-dire à plus de 400 kilomètres de là où je suis ou je peux demander à ce qu'on me renvoit le code de ma carte chez moi sous cinq jours. Je n'aurais pas eu mon billet de retour, je me serais retrouvé coincé avec le souvenir d'une voix très polie mais absolument d'aucun secours. J'ai même un doute, si ça trouve, ma carte était bloquée à l'étranger quoiqu'il arrive. Ca me rappelle une autre histoire qui m'est arrivé lorsque j''étais à Seattle. A minuit, je reçois un appel de la banque pour me dire qu'elle pense que ma carte a été volée car elle a servi à Seattle. Je dormais, je n'ai pas entendu. Lorsque j'écoute le message, je comprends que j'ai quelques minutes pour confirmer qu'on ne me l'a pas volée sous peine de la voir désactivée. Bref, j'ai fait quinze bornes à pied, j'ai un peu mangé au salon où se tenait ma conférence et je ne sais pas si je vais retrouver ma carte demain. C'est un peu le problème du numérique, un mot de passe perdu et c'est potentiellement tout ce à quoi il donnait accès qui est perdu.


more...

Xavier Dupré