L'OSI veut peser dans la définition de l'« IA open source »
À l'origine d'une définition référente de l'open source, l'OSI tente de l'adapter à l'intelligence artificielle.
Vie privée, protection des consommateurs, respect des droits humains... La création des jeux de données est déjà bien encadrée, alors pourquoi y ajouter le copyright ?
Stefano Maffulli avait posé la question en avril dernier, dans le cadre d'un événement de la Free Software Foundation Europe, sous sa casquette de président exécutif de l'OSI (Open Source Initiative). Il avait aussi suggéré de se passer du copyright pour les modèles... et de renoncer plus globalement à toute « licence IA ».
Son intervention avait fait l'objet d'un résumé sur le blog de l'organisation, en un article intitulé « L'importance de l'IA open source et le défi de la libération des données ».
Dans cet article, l'OSI rappelait avoir amorcé, à l'été 2022, un grand tour d'horizon du sujet IA. Il en a résulté un rapport listant trois grands objectifs, dont... limiter l'extension du copyright. Les inquiétudes des citoyens sont compréhensibles, mais il est nécessaire de les mettre en balance avec les besoins de la société, avançait, à cet égard, l'OSI. Et de se prononcer en faveur, sinon de l'ouverture des données, au moins de la notion d'usage raisonnable (fair use).
Le rapport pose une question plus générale : qu'est-ce qu'une « IA open source » ? Ou, sous un autre angle : dans quelle mesure la définition de l'open source peut-elle s'appliquer à l'intelligence artificielle, tant cette dernière estompe la frontière entre code et données ?
L'OSI veut devancer l'AI Act
Dans la lignée de l'« enquête 2022 », une deuxième phase de réflexion a été lancée, officiellement en juin. En toile de fond, notamment, l'AI Act (règlement européen sur l'intelligence artificielle).
Il semble que l'UE établira, dans ce cadre, des exemptions pour les « IA open source ». Sauf que « personne ne sait ce que ça veut dire », clame l'OSI. D'où cette réflexion, censée aboutir à une définition commune.
Une première réunion de cadrage s'est tenue le 21 juin à San Francisco, avec des représentants de Mozilla, Creative Commons, Wikimédia, Internet Archive, la Fondation Linux Europe et OSS Capital.
Les « licences IA » apportant des restrictions d'usage ont été au coeur du débat. En guise d'illustration, l'OSI a retenu, en particulier, le témoignage d'un participant regrettant que Stable Diffusion ne soit pas utilisable pour des applications médicales.
Les exigences d'attribution ont également été sujettes à débat. Un des participants a souligné qu'elles n'étaient pas toujours pertinentes, certaines données n'ayant pas qu'un auteur.
Un workshop a suivi en juillet, lors d'un événement de la Software Freedom Conservancy. Entre autres questions s'est posée celle du droit à la modification de modèles : jusqu'où implique-t-elle d'avoir connaissance du dataset d'origine ?
Une série de webinaires se déroulera de septembre à novembre, avant une réunion à l'Open Source Summit de Bilbao. Un premier brouillon de définition est attendu pour octobre.
Photo d'illustration générée par IA
Sur le même thème
Voir tous les articles Open source