Le machine learning a-t-il oublié sa sécurité ?

Des chercheurs ont testé différentes solutions de machine learning et ont découvert plusieurs failles de sécurité.

Publié par Jacques Cheminat le 24 janv. 2017 | Mis à jour le 2 mars 2021 à 11:30

Lecture
4 min

Imprimer

L'intelligence artificielle est une notion à la mode. Scientifiques, industriels, politiques, tout le monde se penche sur cette prochaine révolution à des degrés divers, techniques, juridiques ou éthiques. Au sein de cette IA, on distingue différentes méthodes dont le machine learning. L'apprentissage automatique permet à travers d'algorithmes d'analyser des grandes quantités de données et apporter une réponse à un problème.

Si aujourd'hui, beaucoup de monde travaille sur l'élaboration des algorithmes et leur amélioration, bien peu se penche sur la question de la sécurité de ces techniques. Un groupe de chercheurs de l'Université du Maryland a découvert plusieurs failles dans le machine learning. Dans un article intitulé « Invocation des démons : A la poursuite des bugs exploitables dans le machine learning », les experts considèrent les systèmes d'apprentissage automatique, comme des boîtes noires, en analysant les données entrées pour livrer des informations en sortie en les traitant avec un algorithme. Mais il est difficile de savoir exactement ce qu'il se passe et comment la machine arrive à donner une réponse. Cette absence de transparence ou de compréhension fait que les vulnérabilités sont difficilement détectables.

Altérer les données d'entrée et modifier l'analyse

Les données d'entrée peuvent être corrompues et entraîner de faux résultats en sortie. « Comme tous les logiciels, les implémentations d'algorithme de machine learning ont des bugs et certains affectent les travaux d'apprentissage. Ainsi, des attaques peuvent être élaborées avec des entrées malveillantes adaptées aux implémentations de machine learning vulnérables », souligne les scientifiques.

Et les conséquences de la manipulation des algorithmes ne sont pas anodines. Il serait techniquement possible d'augmenter les prix des primes d'assurance ou des criminels pourraient échapper à la reconnaissance faciale via des caméras de surveillance (en partant du principe qu'ils connaissent le code source du programme et contrôlent les données d'entrée). Une menace pas si surréaliste quand on sait qu'une majorité des solutions de machine learning sont disponibles en Open Source.

« Une fois que vous commencez à chercher des failles, vous en trouvez de plus en plus. Et nous n'avons pas eu besoin de regarder très loin », explique Tudor Dumitras, un des co-auteurs de l'article et professeur à l'Université du Maryland à nos confrères de The Register. Il ajoute : « La communauté de développeurs n'est pas vraiment consciente du problème, elle ne considère pas cela comme une priorité élevée. »

Dans ses travaux, l'équipe de chercheurs a utilisé des techniques de « fuzzing » (test de données aléatoires) semi-automatisée pour dénicher les bugs dans les logiciels de machine learning. Un premier test a consisté pour changer les entrées et corrompre le système. Pour cela, les scientifiques ont utilisé OpenCV une solution de vision artificielle reposant sur une librairie d'apprentissage automatique. Ils ont débuté par une image contenant un visage humain. Après un « fuzzing » modifiant l'image, elle est ressortie tronquée (cf image ci-dessus).

Quelques failles découvertes

Un autre test dit « American Fuzzy Lop », a permis d'envoyer des entrées fantaisistes pour faire crasher le système et voir où l'algorithme a été modifié. L'équipe a effectué des tests sur 3 programmes : OpenCV (cité précédemment), Malheur, une bibliothèque pour analyser et regrouper les comportements des malwares, et scikit-learn, catalogue d'outils de data mining et d'analyses de données. Les chercheurs ont découvert 7 failles exploitables dont 3 ont été classées dans le référentiel CVE (Common Vulnerabilities and Exposures). Ces vulnérabilités peuvent provoquer l'exécution de code arbitraire ou des attaques par déni de service. Sur les 4 autres brèches découvertes, une a fait l'objet d'un patch disponible sur GitHub. Les autres entraînent un manque de précision dans les résultats et n'ont pas été corrigées.

Avec leurs travaux, les experts veulent sensibiliser les développeurs sur la nécessité d'assurer l'intégrité et la sécurité des algorithmes. « Le machine learning est un domaine relativement nouveau. Si des gens trouvent des bugs, il n'existe pas encore d'analyse systématique des implémentations de machine learning », conclut Tudor Dimotras.

Photo credit: fallsroad via Visualhunt / CC BY-NC-ND

Publié par :
Jacques Cheminat

Tags associés :

#EVERNOTE

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Le machine learning a-t-il oublié sa sécurité ?

Altérer les données d'entrée et modifier l'analyse

Quelques failles découvertes

Photo credit: fallsroad via Visualhunt / CC BY-NC-ND

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

Gouvernance des communications : qui se distingue sur ce marché [...]

AWS Summit : le RAG, au carrefour des stratégies GenAI

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Cybersécurité et digitalisation Comment protéger les [...]

Leader des services de réponse à incident de cybersécurité

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Altérer les données d'entrée et modifier l'analyse

Quelques failles découvertes

Photo credit: fallsroad via Visualhunt / CC BY-NC-ND

S’abonner

Partager l'épisode