Ignite 2023 : dans la « boîte à outils IA » de Microsoft

La conférence Ignite 2023 offre une vitrine sur l'évolution de l'offre Azure AI sous l'angle « LLMOps ». En voici quelques marqueurs.

Publié par Clément Bohic le 16 nov. 2023 | Mis à jour le 17 nov. 2023 à 12:37

Lecture
4 min

Imprimer

Dans quelle mesure les services IA d'Azure se nourrissent-ils les uns des autres ? La conférence Microsoft Ignite 2023 a apporté des éléments de réponse.

En première ligne, Azure AI Studio, actuellement en bêta publique. Ce portail s'inscrit dans la lignée de celui déjà disponible sur l'offre Azure OpenAI Service. Il doit donner accès, entre autres, à des briques du portefeuille Azure AI - en alternative au SDK et au CLI.

Parmi les jonctions à l'étude, il y en a, par exemple, une avec la composante « Analyse de texte » de la gamme Azure AI Speech. Elle permettra d'enrichir les transcriptions (extraction de points-clés, résumé, détection d'informations sensibles...).

Pour guider les utilisateurs dans le choix des modèles, Azure AI Studio embarque des benchmarks. Ils englobent, pour commencer, les familles OpenAI et Llama 2.

À venir également sur AI Studio, une composante dite « Prompt flow ». Elle est déjà disponible sur l'offre Azure ML, qui cible les data scientists.

En mai dernier, alors que le service était en bêta privée sur Azure ML, Microsoft avait mis l'accent sur la fluidification du prompt engineering à renfort de diverses interfaces (notebook, chatbot, graphe acyclique).
L'intégration sur Azure AI Studio, qui vise un public de développeurs, a été synonyme d'ajout d'une expérience « code-first ». Avec un SDK et un CLI qui permettent notamment la gestion de versions, le packaging/déploiement et l'automatisation.

Azure AI enrichi en connexion avec Hugging Face

Divers modèles du hub Hugging Face s'ajoutent au catalogue OpenAI :

- Stable Diffusion (7 modèles, dont 2 pour l'inpainting)
- Falcon (versions 7B et 40B, avec leurs déclinaisons Instruct)
- Whisper v3 (version large)
- CLIP (3 modèles d'OpenAI pour le traitement d'images)
- BLIP (4 modèles de Salesforce pour le même usage)
- SAM (3 modèles de Facebook pour la segmentation d'images)

Microsoft ajoute aussi :

- Deux modèles maison « légers » (1,3B et 2,7B) de la famille Phi
- Code Llama (versions 7B, 13B et 34B, avec leurs variantes Instruct et Python)
- Nemotron-3 8B (5 modèles de NVIDIA dont un de base générateur de texte, un « spécial QA » et trois orientés conversation avec différentes techniques d'entraînement)

Autre ajout prévu : les « modèles en tant que service ». Dans les grandes lignes, Microsoft mettra à disposition une API d'inférence avec paiement à l'usage. Elle permettra d'exploiter les modèles en question sans avoir à réserver de VM. L'initiative touchera aussi au finetuning. La famille Llama 2 ouvrira le bal. Suivront Command (de Cohere), Jais (de G42) et des « modèles premium » de Mistral AI.

Microsoft aussi pousse la recherche vectorielle

Sur le volet VM, on aura noté l'annonce, dans la gamme ND, d'instances à base de GPU AMD Instinct MI300X 192 Go. Le reste du « socle ND » est reconduit (CPU Xeon Scalable 4^e génération, 16 canaux DDR5, InfiniBand 400 Gb/s...).

Pour des modèles nécessitant moins de données et de parallélisme (classification d'images, détection d'objets, NLP n'impliquant pas la génération de nouvelles informations...),les instances H100 v5 sont en preview. Elles reposent sur des EPYC de 4^e génération. La configuration de base allie 40 vCPU, 320 Go de RAM, 1 GPU H100 94 Go et 40 Gbps de bande passante. Deuxième option : le double de ces specs.

Il n'y a pas que sur le traitement de la vidéo (voir notre article) que la recherche vectorielle se répand. La voilà aussi lancée - en GA - sur Azure AI Search (ex-Azure Cognitive Search). Elle associe magasin de vecteurs et bibliothèques clientes (Python, JavaScript, .NET, Java), avec une dose de recherche sémantique (classement des documents et mise en avant des extraits pertinents).

Microsoft travaille, en parallèle, sur un système de vectorisation intégrée. L'objectif : permettre de segmenter et de vectoriser des données lors de l'ingestion. Une option complémentaire au pipeline RAG d'Azure AI Studio. Elle est pour le moment en bêta publique, avec un exemple de mise en application sur Azure SQL Database.

Sur le volet bases de données, on signalera l'ajout d'une extension Azure AI pour Azure Database avec PostgreSQL. Elle permet d'accéder aux services Azure OpenAI et Azure AI Language par des appels de fonctions dans les requêtes SQL.

Illustration principale © Ben - Adobe Stock

Publié par :
Clément Bohic

Tags associés :

#MICROSOFT

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Ignite 2023 : dans la « boîte à outils IA » de Microsoft

Azure AI enrichi en connexion avec Hugging Face

Microsoft aussi pousse la recherche vectorielle

Process mining : l'automatisation est de moins en moins une option

Déployer l'IA à l'échelle : l'approche d'AXA, entre vision et [...]

Chez Eiffage, l'IA générative au service des métiers

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

S’abonner

Briser les barrières de la sécurité en entreprise

The Forrester Wave™: Cloud Workload Security, Q1 2024

Moderniser vos postes de travail grâce à [...]

Il y a des phrases qu’on ne veut plus entendre… [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Azure AI enrichi en connexion avec Hugging Face

Microsoft aussi pousse la recherche vectorielle

S’abonner

Partager l'épisode