Comment le Machine Learning aide à débusquer les failles de sécurité

Des chercheurs américains ont eu l'idée d'appliquer des analyses de type Big Data, dont du Machine Learning, aux forums et places de marché de hackers. Avec pour objectif d'anticiper sur les futures menaces.

Publié par La rédaction le 10 août 2016 | Mis à jour le 2 mars 2021 à 02:30

Lecture
3 min

Imprimer

Et s'il n'était plus besoin d'attendre l'exploitation d'une vulnérabilité pour identifier la menace ? Et s'il était possible d'anticiper la diffusion d'un malware exploitant une faille connue mais pas encore massivement corrigée chez les utilisateurs ? C'est à ces perspectives, à même de changer la vie des éditeurs souvent confrontés à des vulnérabilités inconnues (dites zero day) qu'ils sont contraints de combler dans l'urgence, que travaillent des chercheurs de l'université de l'Arizona, en exploitant pour ce faire les capacités du Machine Learning.

L'idée est assez simple et, à la fois, totalement novatrice. Elle consiste à exploiter le potentiel de l'intelligence artificielle pour analyser les forums de hacking et les places de marché d'outils de piratage. Des services présent sur le dark net (utilisant des techniques d'anonymisation) ou le deep web (exploitant la part du Web non référencée par les moteurs de recherche). La plate-forme de renseignement sur les menaces (threat intelligence) montée par les chercheurs, dont l'objectif est de trouver des indices sur des vulnérabilités émergentes, remonte déjà 305 alertes de sécurité de bonne qualité par semaine, selon l'équipe de l'université de l'Arizona, emmenée par Eric Nunes. Le système, qui est pleinement opérationnel selon les affirmations des chercheurs, permet ainsi d'identifier de nouveaux malwares ou exploits, avant leur utilisation dans une cyber-attaque.

27 places de marché, 21 forums

Pour suivre l'activité des hackers, les chercheurs ont développé des crawler (robots parcourant le web) afin de récupérer l'information sur les forums et places de marché du hacking. Des robots à qui ils ont désigné les sources les plus pertinentes (27 places de marché et 21 forums) et qu'ils ont conçus pour ne récupérer que les données relatives à la vente de malwares ou d'exploits et celles des posts traitant de menaces ou d'offres de service de piratage (les places de marché ou forums hébergent d'autres activités criminelles, comme la vente de drogue ou d'armes). Ces informations sont ensuite stockées dans des bases de données relationnelles.

L'algorithme de Machine Learning est exploité pour isoler les produits et sujets les plus pertinents discutés par les communautés de hackers. Pour ce faire, les chercheurs utilisent l'expertise humaine afin d'accélérer l'apprentissage de la machine. 25 % des contenus sont classés par des experts et ce sont ces indications qui permettent à l'algorithme de se montrer plus pertinent.

16 exploits zero day identifiés

Selon l'équipe d'Eric Nunes, cette première approche a permis de bâtir un système opérationnel offrant des résultats intéressants (taux de rappel de 92 % sur les places de marché et de 80 % sur les forums pour une précision avoisinant les 80 % dans les deux cas). Avec de premiers résultats concrets prometteurs : « Sur une période de 4 semaines, nous avons détecté 16 exploits zero day à partir des données des places de marché », affirment les chercheurs, dans leur article de recherche. Dont un code significatif pour Android, qui était proposé à 20 000 dollars, et un second exploit pour Internet Explorer 11, vendu 10 000 dollars.

L'équipe de recherche indique qu'elle entend désormais transférer son outil à un partenaire qui sera chargé de sa commercialisation.

ThreatQuotient livre une bibliothèque universitaire automatisée des menaces

Ralentir les hackers, la meilleure façon de les éloigner

Photo credit: Gene Kogan via Visual hunt / CC BY-NC

Publié par :
La rédaction

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Comment le Machine Learning aide à débusquer les failles de sécurité

27 places de marché, 21 forums

16 exploits zero day identifiés

Photo credit: Gene Kogan via Visual hunt / CC BY-NC

Le cas Snowflake, symbole de la résurgence des infostealers

{ Tribune Expert } - L'enjeu croissant de préserver la valeur de l'IA

{VIDEO} Audrey Amedro, Jizo AI : « Les éditeurs français de [...]

{ Tribune Expert } - Le rôle des RSSI dans la gestion des IAM [...]

SASE : la convergence cyber et SD-WAN est en marche

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

27 places de marché, 21 forums

16 exploits zero day identifiés

Photo credit: Gene Kogan via Visual hunt / CC BY-NC

S’abonner

Partager l'épisode