Le machine learning pour retrouver l’auteur d’un code informatique

Par Siècle digital
Publié le 15/08/2018 à 08:45 | https://siecledigital.fr/
 

Deux chercheuses américaines ont révélé lors d’une conférence au dernier DEF CON, une convention de hackers prestigieuse qui a lieu chaque année depuis 1993 à Las Vegas, qu’il était possible de reconnaître les développeurs rien qu’à partir de leur production de code, et ce grâce au machine learning. On parle alors de « désanonymisation » du code informatique, qui peut être publié anonymement de la part des développeurs sur les plateformes open-source comme GitHub.

Poussant encore plus loin les techniques développées par la stylométrie, la science qui permet d’identifier le style d’un texte, le machine learning arrive à reconnaître les caractéristiques spécifiques à un développeur à partir d’un extrait de code informatique.