CCFI

IA : les médias français s’organisent face à la collecte de données par les robots

A l’image du « New York Times », quelques sites français, dont ceux de Radio France et TF1, empêchent le robot GPTBot d’OpenAI de se nourrir de leurs contenus. Refusant d’être « pillé », le secteur réfléchit à la manière d’obtenir une juste rémunération de la part des géants de l’IA.

Face à l’exploitation de leurs contenus par des algorithmes d’intelligence artificielle, les médias français sont décidés à ne pas se laisser faire. Selon nos informations, plusieurs sites d’information ont déjà bloqué la collecte de données par le robot d’exploration Web d’OpenAI, GPTBot, à l’image de leurs confrères anglo-saxons du « New York Times », de CNN ou de Reuters.

Le 8 août, OpenAI a annoncé le lancement de son robot pour ratisser automatiquement les données de « tout Internet », afin d’entraîner ses modèles d’IA GPT-4 et GPT-5. La firme a alors donné la possibilité aux éditeurs de sites d’interdire l’accès au robot. Radio France l’a instantanément saisie en bloquant GPTBot à titre conservatoire dès le 10 août, a annoncé le groupe dans un tweet. Les sites Radiofrance.fr, francebleu.fr et francetvinfo.fr sont concernés.

« Nos contenus ont de la valeur et une finalité initiale, qui est de les diffuser auprès du grand public pour assurer nos missions de service public, insiste Laurent Frisch, le directeur du numérique et de la stratégie d’innovation de Radio France. Il n’entre pas dans nos missions de servir gratuitement de nourriture aux algorithmes. En indexant des sites dont les informations ont un réel coût de production, les bots se créent de la valeur pour eux-mêmes à coût nul. »

Blocage préventif

Selon nos informations, tous les sites de France Médias Monde (dont France24.com, RFI.fr et mc-doualiya.com) ont aussi bloqué GPTBot quelques jours plus tard, à titre préventif, en attendant d’éventuelles discussions avec OpenAI. « Ils veulent utiliser nos données pour entraîner leurs modèles d’IA, sans partage de valeur, en mettant éventuellement nos contenus à disposition d’acteurs qui proposeront ensuite des produits commerciaux, ce que l’on refuse », tranche Vincent Fleury, le directeur des Environnements numériques de France Médias Monde.

Dans la même logique, TF1 a bloqué GPTBot sur ses sites tf1.fr (MyTF1) et tf1info.fr. Le groupe ne fait pas de commentaires. La plateforme d’information locale Actu.fr, au sein de Publihebdos, filiale du groupe Sipa – Ouest-France, a pris la même décision.

« Nos contenus sont notre richesse, insiste Francis Gaunand, le PDG de Publihebdos. Nous ne voulons pas que la propriété intellectuelle qui revient à nos auteurs leur échappe par le biais d’une recréation ou d’une réécriture par une IA générative », souligne-t-il. Actu.fr s’estime déjà victime d’un site qui se nourrirait de ses contenus pour produire des articles grâce à l’IA.

Le blocage reste pour l’instant une position minoritaire. Tous les médias interrogés s’accordent en revanche sur la nécessité d’obtenir une juste rémunération contre l’usage de leurs contenus, à l’image des négociations qui avaient permis la rétribution des droits voisins par les plateformes numériques comme Google ou Facebook.

Négociations en vue

« Avec cette utilisation massive de nos contenus pour entraîner une IA, sans rétribution en contrepartie, nous entrons dans un nouveau champ de conflit, estime Pierre Louette, le PDG du groupe Les Echos – Le Parisien. Certains acteurs peuvent redouter de croiser de nouveau le fer avec ces gens qui sont si déterminants pour notre trafic et nos revenus publicitaires, mais c’est toujours la même bataille qui se poursuit. »

Selon le vice-président de l’Alliance de la presse d’information générale, « il faut créer les conditions d’une forme de ‘new deal’, et pour cela comprendre qui moissonne quel contenu, ce qu’ils en font et trouver une clé de partage de la valeur. Les ingrédients de l’IA doivent être rémunérés ».

Certains s’interrogent sur l’opportunité de faire front collectivement. « Le Figaro » n’a pas arrêté sa position, mais « nous allons chercher des accords de licence et de rémunération avec ces plateformes pour l’utilisation qui a été faite et sera faite de nos contenus », confirme Bertrand Gié, directeur du pôle News du journal et aussi président du Geste, le syndicat des éditeurs en ligne. Faute d’accord, il faudra bloquer l’accès, convient-il.

Le groupe Le Monde a lui pris les devants et contacté OpenAI et Google (pour son IA Bard) afin d’ouvrir des discussions. « L’IA fait courir un risque systémique à beaucoup de groupes de médias, insiste Louis Dreyfus, le président du directoire du groupe Le Monde. Elle pose le risque que les informations produites soient mêlées à d’autres de moindre qualité ou biaisées, et pose aussi un problème de modèle économique, car nous défendons l’exclusivité de nos contenus et un recours important à l’abonnement. » D’où la nécessité d’agir vite. Le groupe Le Monde espère un accord d’ici la fin de l’année.

 

Lire : Les Echos du 28 août

 

Jean-Philippe Behr

Nos partenaires

Demande d’adhésion à la CCFI

Archives

Connexion

Vous n'êtes pas connecté.

Demande d’adhésion à la CCFI