Le succès d’OpenAI risque fort de lui coûter de plus en plus cher. Déjà aux prises avec la problématique de sa grandissante facture informatique (700.000 dollars par… jour), le laboratoire d’intelligence artificielle à l’origine du phénomène ChatGPT fait maintenant face à des revendications très intéressées de la part de certains sites Web. Ils reprochent à la société valorisée plus de 29 milliards de dollars d’avoir aspiré leurs contenus pour entraîner ses algorithmes, sans aucune contrepartie financière.
Ainsi la plateforme de forums de discussion Reddit va bientôt rendre payant l’accès à ses données en cas d’utilisation intensive telle que procédé par OpenAI. Pour rendre leur logiciel conversationnel capable d’apporter une réponse construite à n’importe quelle question, les pères de ChatGPT ont de leur propre aveu travaillé en grande partie avec des conversations de Reddit. Google a fait de même pour son service rival, Bard.
Appels à la négociation
« Nous n’avons pas besoin de donner gratuitement toute cette valeur à certaines des plus grandes entreprises du monde », a indiqué mi-avril au « New York Times » Steve Huffman, le fondateur et directeur général du site aux 57 millions d’utilisateurs par jour, en pleine préparation de son introduction en Bourse.
Quelques jours plus tard, le patron de Stack Overflow, un forum consacré à des millions de questions de développement informatique, défendait le même point de vue. « Les plateformes communautaires qui alimentent les grands modèles de langages doivent absolument être rémunérées pour leurs contributions », poussait Prashanth Chandrasekar dans « Wired », en soutien à Reddit.
Nouveau rival d’OpenAI, Elon Musk a, lui aussi, récemment semblé accuser ChatGPT de pomper illégalement les données de Twitter et a menacé de poursuites devant les tribunaux. Réunie au sein de la News Media Alliance, la presse anglo-saxonne appelle de son côté OpenAI à entrer en négociation.
Réflexions en France
Alors que ChatGPT est désormais consulté par près de 200 millions d’utilisateurs par mois, l’entreprise de Sam Altman se retrouve en première ligne pour défendre les sources de connaissance de son chatbot révolutionnaire. L’enjeu n’est pas neutre dans un contexte où OpenAI pourrait voir son corpus de données d’entraînement se réduire également par l’action des CNIL européennes au nom de la protection des données personnelles .
En France, les mêmes réflexions commencent à poindre. Mais le sujet est encore embryonnaire par rapport au débat outre-Atlantique. « Je n’ai pas la moindre idée de si OpenAI aspire nos sites Web », reconnaît Antoine Hermite, le directeur général de Webedia, l’éditeur de Jeuxvideo.com et d’AlloCiné. A la tête de LeBonCoin, le groupe Adevinta rappelle que la pratique est interdite et qu’elle essaye de s’en prémunir à l’aide d’un logiciel de cybersécurité.
Le rêve des droits voisins sur ChatGPT
Rien n’empêche toutefois de rêver de récupérer une part du succès américain. Alors qu’il est difficile de détecter le passage des robots d’indexation d’OpenAI, le Geste (la fédération de 90 éditeurs en ligne) travaille sur un marqueur technique. L’idée est ensuite d’ouvrir la voie à des négociations.
Il est assez utopique d’imaginer un accord commercial.
Jérémy Parola directeur du numérique de Reworld Media
« Il est assez utopique d’imaginer un accord commercial avec ces sociétés qui nous diront qu’elles ne tirent pas directement profit de nos contenus. Mais elles font un profit indirect, ce qui ouvre la voie à une rémunération via les droits voisins », note Jérémy Parola, le directeur du numérique de Reworld Media (Doctissimo, Marmiton). A la manière de ce qui s’est fait avec Google et Meta, il espère un cadre législatif qui, tôt ou tard, pousserait OpenAI à discuter avec les éditeurs.
Lire l’article complet sur : www.lesechos.fr
Leave A Comment