Sam Altman, à côté d'un smartphone affichant le logo d'OpenAI © Rokas Tenys / Shutterstock
Sam Altman, à côté d'un smartphone affichant le logo d'OpenAI © Rokas Tenys / Shutterstock

La firme qui a développé ChatGPT, OpenAI, s'est à nouveau exprimée sur la question des droits d'auteurs de contenus utilisés dans son industrie. Et pour la société de Sam Altman, lesdits droits d'auteurs seraient un écueil pour la technologie !

Si l'on a beaucoup glosé quant aux capacités toujours plus étonnantes des IA qui nous sont proposées depuis maintenant deux ans, la question cruciale des données utilisées dans l'industrie est aussi de plus en plus pointée du doigt. Les géants du secteur ont en effet quasiment tous été accusés de piocher dans des œuvres pourtant protégées par le droit d'auteur, afin d'entraîner leurs intelligences artificielles. Une pratique qu'OpenAI ne nie plus aujourd'hui, et qui serait même obligatoire si l'on en croit la société partenaire de Microsoft !

Utiliser seulement du contenu libre de droits ne permettrait pas de développer des IA

OpenAI, qui est en ce moment pris dans une bataille judiciaire avec le New York Times sur la question des droits d'auteur, vient à nouveau de s'exprimer sur le sujet devant, cette fois, une sous-commission de la Chambre des Lords, au Royaume-Uni. Et l'affirmation qui y a été faite peut se résumer ainsi : il est impossible de concilier respect des droits d'auteurs et développement d'IA performantes !

« Étant donné que le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine - y compris les articles de blog, les photographies, les messages de forum, les bouts de code de logiciel et les documents gouvernementaux - il serait impossible d'entraîner les meilleurs modèles d'IA actuels sans utiliser des documents protégés par le droit d'auteur » explique l'entreprise californienne.

© Shutterstock
© Shutterstock

« La loi sur le droit d'auteurs n'interdit pas l'entraînement » pour OpenAI

Elle ajoute, un brin moqueuse, que « limiter les données d'entraînement aux livres et dessins du domaine public créés il y a plus d'un siècle pourrait donner lieu à une expérience intéressante », mais ne donnerait par contre pas naissance à une technologie fonctionnelle.

Une question un brin inepte de toute manière si l'on suit toujours l'argumentation de la start-up californienne, qui pèse toujours plus lourd financièrement dans le monde de la tech. Car pour elle, de toute manière, « la loi sur le droit d'auteurs n'interdit pas l'entraînement. » Ce qui, en creux, signifie, que toutes les actions en justice intentée contre elle depuis plus d'un an n'auraient aucun fondement. Une affirmation qui devrait trouver beaucoup de contradicteurs.

  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code
8 / 10