La GenAI appliquée à la supervision de posture de sécurité : le cas LinkedIn

Pour doter son système de gestion de posture de sécurité d'une interface en langage naturel, LinkedIn a mis en oeuvre une approche mêlant GraphQL et Cypher.

Publié par La rédaction le 13 nov. 2024 | mis à jour à 18:34

Lecture
3 min

Imprimer

Utiliser à la fois GraphQL et Cypher ? LinkedIn a fait ce choix pour intégrer une interface GenAI à sa plate-forme de gestion de posture de sécurité.

Cette interface, destinée à soumettre des requêtes en langage naturel, est venue compléter l'API et le playground GraphQL.

Un dataset de requêtes et de réponses prédéfinies constitue le socle d'entraînement du LLM sous-jacent (made in OpenAI). Ce dernier génère ensuite des données synthétiques simulant des scénarios potentiels. Elles sont enrichies par des métadonnées relatives aux interactions utilisateur. L'ensemble est vectorisé et indexé pour constituer une base de contexte.

Un système de double requête

Pour transformer les requêtes en instructions de récupération de données, LinkedIn s'appuie sur un graphe de connaissances qui modélise son inventaire. Celui-ci se nourrit d'une vingtaine de sources.

Les requêtes GraphQL pouvant nettement varier selon les cas d'usage, il peut être délicat d'exploiter les capacités d'appel de fonctions des LLM. LinkedIn a donc décidé de les mapper aux différents types de noeuds du graphe, aidant le modèle à choisir les plus pertinents.

Une fois les bons noeuds identifiés, le système construit un prompt qui inclut la question initiale ainsi que les propriétés sélectionnées et les exemples de requêtes associés. Le LLM traite ce prompt pour générer des requêtes Cypher.

Le système est censé adapter les prompts à l'évolution du contexte - qu'il peut affiner à renfort de recherche sémantique si des imprécisions apparaissent. Au cas où la requête principale ne produit pas de résultats satisfaisants, s'enclenche un mécanisme engendrant des requêtes secondaires (Cypher ou GraphQL). Les utilisateurs peuvent modifier ces requêtes.

Les outputs sont synthétisés et stockés temporairement pour être ajoutés aux questions ultérieures liées à une même session. L'un des défis en la matière est de traiter ces questions lorsque l'intention change.

Les travaux avaient débuté trois générations GPT en amont, avec le modèle Davinci. Le taux de précision était alors de l'ordre de 40 à 50 %, affirme LinkedIn. Avec la génération GPT-4, il est passé à 85-90 %.

À consulter en complément :

Du RAG aux agents, les choix GenAI de Doctolib
La RPA se met au diapason de la GenAI
Les LLM Granite 3.0 d'IBM, signes des temps
Mistral AI ouvre la porte aux LLM embarqués
Coder avec l'IA : les lignes directrices de l'ANSSI

Illustration Alexey Novikov - Adobe Stock

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

La GenAI appliquée à la supervision de posture de sécurité : le cas LinkedIn

Un système de double requête

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

Gouvernance des communications : qui se distingue sur ce marché [...]

MLPerf : la quête de benchmarks IA représentatifs

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Un système de double requête

S’abonner

Partager l'épisode