2A.ml - Machine Learning et données cryptées#

Links: notebook, html, python, slides, GitHub

Comment faire du machine learning avec des données cryptées ? Ce notebook propose d’en montrer un principe exposé dans CryptoNets: Applying Neural Networks to Encrypted Data with High Throughput and Accuracy.

%matplotlib inline

from jyquickhelper import add_notebook_menu
add_notebook_menu()

Principe #

Le machine learning sur des données cryptées repose sur un algorithme de chiffrement_homomorphe ou homomorphic encryption. Ce concept a été inventé par Craig Gentry (lire Fully Homomorphic Encryption Using Ideal Lattices, Fully Homomorphic Encryption over the Integers). On note $x \rightarrow \varepsilon(x)$ une fonction de chiffrement complètement homomorphe. Il vérifie :

$\begin{array}{ll}\varepsilon(x+y) = \varepsilon(x) + \varepsilon(y) \\ \varepsilon(x*y) = \varepsilon(x) * \varepsilon(y)\end{array}$

. Dans l’exemple qui suit, nous avons besoin que le système de cryptage soit partiellement homomorphe : seule l’addition est stable une fois l’entier crypté.

Un exemple : $\varepsilon:\mathbb{N} \rightarrow \mathbb{Z}/n\mathbb{Z}$ et $\varepsilon(x) = (x * a) \mod n$ . Cela veut dire que l’on peut crypter des données, faire des calculs avec et décrypter un résultat qui serait presque le même que si les calculs avaient été fait sur les données non cryptées.

Exercice 1 : écrire deux fonctions de cryptage, décryptage #

Il faut bien choisir $n$ , $a$ pour implémenter la fonction de cryptage : $\varepsilon:\mathbb{N} \rightarrow \mathbb{Z}/n\mathbb{Z}$ et $\varepsilon(x) = (x * a) \mod n$ . On vérifie ensuite qu’elle conserve l’addition au module $n$ près.

Exercice 2 : Entraîner une régression linéaire #

from sklearn.datasets import load_diabetes
data = load_diabetes()

X = data.data
Y = data.target

A quelle condition peut-on aussi entraîner un modèle sur des données cryptées ?
Et les arbres de décision ?

Liens

Contenu

Information

Sujet précédent

Sujet suivant

2A.ml - Machine Learning et données cryptées#

Principe #

Exercice 1 : écrire deux fonctions de cryptage, décryptage #

Exercice 2 : Entraîner une régression linéaire #

Exercice 3 : réécrire la fonction de prédiction pour une régression linéaire #

Exercice 4 : assembler le tout #

Questions #

Liens

Contenu

Information

Sujet précédent

Sujet suivant

2A.ml - Machine Learning et données cryptées#

Principe#

Exercice 1 : écrire deux fonctions de cryptage, décryptage#

Exercice 2 : Entraîner une régression linéaire#

Exercice 3 : réécrire la fonction de prédiction pour une régression linéaire#

Exercice 4 : assembler le tout#

Questions#

Principe #

Exercice 1 : écrire deux fonctions de cryptage, décryptage #

Exercice 2 : Entraîner une régression linéaire #

Exercice 3 : réécrire la fonction de prédiction pour une régression linéaire #

Exercice 4 : assembler le tout #

Questions #