Dans une lettre adressée lors d’une enquête de la Chambre des Lords britannique, OpenAI a reconnu qu’il était impossible de former des « IA leaders » sans utiliser de contenu protégé par le droit d’auteur. À présent, c’est Meta qui, face à des poursuites engagées par un groupe d’artistes dont Sarah Silverman et l’auteur Richard Kadrey, admet avoir utilisé des « portions de Books3 » pour former son IA Llama, avant son lancement public. Books3, qui a été retirée en ligne pour ses 37 Go de texte ou environ 200 000 livres d’œuvres piratées…
Ce recours collectif contre Meta, les accusant d’avoir utilisé des livres piratés pour former leur IA LlaMA, mentionne notamment le référentiel Books3 : « Meta admet avoir utilisé des portions de l’ensemble de données Books3, parmi de nombreux autres documents, pour former Llama 1 et Llama 2 », a déclaré l’entreprise de Mark Zuckerberg, dans une réponse.
Cependant, la multinationale affirme que « dans la mesure où une réponse est considérée comme nécessaire, elle nie que l’utilisation de travaux protégés par le droit d’auteur pour former Llama nécessitait le consentement, la reconnaissance ou la compensation. »
Elle s’appuie pour ce faire sur la doctrine américaine de « l’usage équitable », et ainsi affirme n’avoir enfreint les droits d’auteur des plaignants. « Dans la mesure où Meta a fait des copies non autorisées d’œuvres protégées par le droit d’auteur des plaignants, de telles copies constituent une utilisation équitable en vertu de l’article 107 du titre 17 du Code des États-Unis », écrit la société…