Ces derniers mois, plusieurs éditeurs ont annoncé qu’ils concédaient des licences sur leur contenu scientifique pour qu’il soit utilisé comme données de formation dans le cadre des LLM. Ces accords montrent que les grands éditeurs sont aux prises avec leur stratégie dans un contexte d’incertitude. Pour comprendre la dynamique de ce marché en plein développement, Ithaka S+R a lancé un outil de suivi de ces accords de licence. Il y répertorie (lorsque l’information est disponible) l’éditeur, l’acheteur, le type et la taille de l’accord, ainsi que l’impact et la stratégie de l’accord. Roger Schonfeld fournit une analyse plus approfondie de ces accords dans son article Scholarly Kitchen, “Tracking the Licensing of Scholarly Content to LLMs.”
Jusqu’à présent, plusieurs grands éditeurs ont annoncé des accords. Pour eux, il y a une augmentation substantielle des revenus à court terme. L’idée de base de ces accords est de générer des revenus pour la maison d’édition en échange d’un accès facile, fiable et légal au contenu du LLM. Un certain nombre d’entreprises sont à la recherche de ce contenu, notamment OpenAI et Google, mais aussi Apple et des fournisseurs plus spécialisés.
Jusqu’à présent, il n’existe pas encore de conditions standard ou de modèle global à partir desquels ces accords pourraient être conclus. Le prix est bien sûr la priorité pour tout le monde, mais il y a aussi beaucoup d’autres considérations à prendre en compte. Il y a des questions techniques et de réputation sur la façon dont les corrections ou les rétractations se propageront à travers un LLM et si un auteur peut se retirer, et il y a des questions de modèle commercial telles que la question de savoir si la provenance sera suivie à travers le résultat d’un LLM de sorte qu’une citation ou un lien puisse être fourni dans le registre académique, pour ne prendre que quelques exemples simples.
A voir: https://sr.ithaka.org/our-work/generative-ai-licensing-agreement-tracker/