Pour gérer vos consentements :
Categories: Développeurs

Stack Overflow veut contraindre les entreprises d’IA à payer

Comme Reddit etTwitter, Stack Overflow, ressource de référence et plateforme d’entraide des programmeurs, veut contraindre les entreprises d’intelligence artificielle (IA) à payer pour accéder aux données qu’elles utilisent pour entraîner leur technologie.

Comme a relevé Wired, les sociétés actives dans l’IA, dont OpenAI et DeepMind (Google), collectent et traitent des données massives en ligne pour entraîner leur technologie et livrer des réponses aux requêtes d’humains, y compris concernant le code et la programmation informatique. Jusqu’à présent, elles ont pu le faire sans créditer, ni rétribuer les produteurs et les éditeurs de ces données.

Afin de mieux appréhender cette boîte noire, une autre source, le Washington Post, dit avoir étudié le jeu de données C4 (Colossal Clean Crawled Corpus) qu’utilise Google. Cet ensemble agrège le contenu de 15 millions de sites web, Stack Overflow inclus. Autant de données utilisées pour former de grands modèles de langage (LLM) de langue anglaise, tels que T5 de Google et LLaMA de Facebook. Il convient de noter qu’OpenAI ne divulgue pas les jeux de données utilisés pour entraîner son chatbot ChatGPT.

Le modèle de Stack Overflow impacté

Le CEO de Stack Overflow, Prashanth Chandrasekar, a indiqué prévoir de facturer dès cet été aux développeurs en IA l’accès aux données que traite la plateforme.

« Les plateformes communautaires qui alimentent les LLM [grands modèles de langage] devraient absolument être rémunérées pour leur contribution afin que des entreprises comme la nôtre puissent réinvestir dans leurs communautés et continuer à les faire prospérer », a déclaré le dirigeant, cité par Wired.

« Nous soutenons vivement l’approche de Reddit » sur ce sujet, a-t-il ajouté.

Il en va de la pérennité du modèle de ces plateformes. Celles-ci tirent profit de publicités qui s’affichent sur leur site en fonction des données qui y sont partagées et, dans une moindre mesure, de services payants.

Or, l’ascension de ChatGPT depuis son lancement public, et sa popularité grandissante auprès d’un public large, développeurs inclus, impacte déjà Stack Overflow.

En mars 2023, d’après une analyse de SimilarWeb rapportée par VentureBeat, un recul de près de 14% en glissement annuel du trafic de Stack Overflow a été constaté.

(crédit photo © Shutterstock)

Recent Posts

Thomas Gourand, nouveau Directeur Général de Snowflake en France

Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…

52 minutes ago

Accord Microsoft-CISPE : comment Google a tenté la dissuasion

Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…

56 minutes ago

Vers des mises à jour cumulatives intermédiaires pour Windows

Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…

2 heures ago

RH, finances, stratégie… Les complexités de la Dinum

De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…

21 heures ago

SpreadSheetLLM ou la promesse d’une GenAI plus à l’aise avec Excel

Sous la bannière SpreadSheetLLM, Microsoft propose un framework destiné à optimiser le traitement des feuilles…

22 heures ago

Comment AT&T a payé une rançon pour le vol de ses données

Selon le magazine Wired, AT&T aurait payé près de 400 000 $ à un pirate…

24 heures ago