Ignite 2023 - Microsoft et l'IA : coup d'oeil sur le traitement d'images

Aperçu, à la faveur de la conférence Microsoft Ignite 2023, de l'évolution des services de traitement des images sur Azure.

Publié par Clément Bohic le 16 nov. 2023 - mis à jour à 15:56

Lecture
3 min

Imprimer

Comment l'offre de services de traitement du langage naturel se développe-t-elle chez Microsoft ? Dans le cadre de la conférence Ignite 2023, nous avons fait un bilan.
En voici un autre, axé sur la discipline de la vision par ordinateur.

Sur Video Indexer

[Ce service fait partie de l'offre Azure AI, orientée développeurs par opposition à Azure ML, axé data scientists. Il s'appuie sur une trentaine d'IA pour traiter les vidéos.]

Video Indexer fait partie des services que Microsoft propose d'exécuter en périphérie, à travers Azure Arc. Il faudra plus précisément attendre le 15 décembre 2023. À partir de là, on pourra expérimenter cette « version edge » qui reposera sur un cluster AKS. Les fonctionnalités disponibles : transcription, traduction/sous-titrage, extraction de scènes, OCR, détection d'objets... et intégration de modèles tiers. En cas de manque de ressources, les traitements déborderont dans le cloud.

Autre nouveauté de Video Indexer mise en avant à l'occasion de l'Ignite 2023 : la possibilité d'ajouter des étiquettes personnalisées et du texte libre en guise de métadonnées. Ces éléments seront pris en compte lors de la recherche.

À noter également, une bêta en accès limité pour des fonctionnalités additionnelles de personnalisation du modèle People - destiné à reconnaître des personnes spécifiques.

- Un « score de qualité » basé sur le nombre d'images utilisées pour l'annotation
- La possibilité de définir, au niveau utilisateur, un autre modèle par défaut que le standard
- Le regroupement des images non identifiées mais susceptibles de représenter une même personne (illustration ci-dessous)

Sur AI Vision

[Cette gamme regroupe quatre services, sous les marques OCR, Analyse d'image, Visage et Analyse spatiale.]

Une fonctionnalité déjà présente dans Windows Hello fait son apparition sur l'API Visage : la détection de présence physique. Objectif : s'assurer, lors d'une reconnaissance faciale, qu'on est bien en présence d'une personne.

Autre API qui évolue : celle dédiée à l'analyse d'image. Elle passe en v4 avec, entre autres capacités, le légendage par objet. Sous le capot, il y a Florence, un LLM made in Microsoft.

Sous la marque Video Retrieval, Microsoft introduit un système d'indexation vectorielle de vidéos. Il alimentera notamment le modèle GPT-4 « avec vision », promis en bêta publique « pour bientôt » sur Azure OpenAI Service.

Sur Azure OpenAI Service, il y a aussi du nouveau en matière de « sûreté de l'IA ». Dont la possibilité de configurer la sensibilité de tous les filtres de contenu.

Un système de détection d'anomalies liées à l'injection de prompts est en bêta publique. Idem pour la détection d'éléments « protégés ». Optionnelle, elle empêche les IA de produire des contenus correspondant à deux index, dont un fondé sur les projets GitHub publics.

S'y ajouteront « bientôt » les filtres asynchrones. La modération pourra donc s'effectuer « au fil de l'eau ». Et le contenu, s'afficher progressivement, plutôt que d'attendre qu'il soit complètement généré pour ensuite le modérer.

Illustration principale © Patrick Helmholz - Adobe Stock

Publié par :
Clément Bohic

Tags associés :

#MICROSOFT

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Ignite 2023 - Microsoft et l'IA : coup d'oeil sur le traitement d'images

Sur Video Indexer

Sur AI Vision

La CNIL face aux limites du chiffrement homomorphe

Quelle infrastructure on-premise pour porter une stratégie IA ?

De l'UX à l'AX : penser les interfaces pour les agents IA

Avec les LLM, peut-on concilier qualité et diversité des réponses ?

IA et copyright : la perspective d'une norme IETF réconciliatrice

S’abonner

La meilleure liste de contrôle de Sécurité du code au cloud

VSP One Block, la simplification de la gestion des [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Sur Video Indexer

Sur AI Vision

S’abonner

Partager l'épisode