Home » OpenAI annonce une offre annuelle d’un million de dollars pour les éditeurs

OpenAI annonce une offre annuelle d’un million de dollars pour les éditeurs

by sysadmin
0 comments 7 views 2 minutes read
A+A-
Reset

Les entreprises telles que OpenAI ont commencé à payer des prix pour obtenir des informations protégées par des droits d’auteur, ce qui se manifeste par la conclusion d’accords entre les éditeurs de nouvelles et les entreprises d’intelligence artificielle pour former les modèles aux histoires d’actualités.

Un nouveau rapport indique qu’OpenAI propose des montants allant de un million à cinq millions de dollars par an pour obtenir des licences d’articles de presse protégés par des droits d’auteur afin de former ses modèles d’intelligence artificielle.

Ces chiffres sont considérés comme les premiers indicateurs des montants que les entreprises d’intelligence artificielle envisagent de verser pour les matériaux sous licence.

Ces chiffres apparaissent en même temps qu’un rapport récent indiquant qu’Apple envisage de s’associer à des entreprises médiatiques pour utiliser du contenu afin de former l’intelligence artificielle et investir environ 50 millions de dollars sur plusieurs années pour les données.

Les chiffres semblent être semblables à certains accords de licence précédents non liés à l’intelligence artificielle.

Les rapports précédents ont indiqué que Meta a offert environ 3 millions de dollars par an pour la licence des histoires d’actualités, les gros titres et les aperçus lorsqu’elle a lancé l’onglet Facebook News.

Il n’est pas clair si le montant total des paiements d’OpenAI équivaut à certains chiffres élevés qui ont été annoncés auparavant, car Google a annoncé en 2020 qu’elle investissait un milliard de dollars au total pour s’associer avec des institutions de presse.

Sous la pression d’une nouvelle loi, Google a accepté précédemment de verser environ 100 millions de dollars par an aux éditeurs canadiens en échange de la possibilité de lier leurs articles.

Les modèles linguistiques utilisent des informations extraites d’Internet pour l’entraînement, et certaines méthodes d’intelligence artificielle ne révèlent pas comment elles ont obtenu les données d’entraînement, bien que les informations soient souvent disponibles via des ensembles de données ou des robots d’indexation web.

Le prix des ensembles de données d’entraînement varie en fonction du fournisseur, de la taille et du contenu de l’ensemble de données.

Les développeurs d’intelligence artificielle développent des robots web qui collectent des données en ligne pour aider à former de grands modèles linguistiques, et ils emploient des personnes pour examiner, étiqueter et parfois nettoyer les données d’entraînement, ce qui augmente considérablement les coûts opérationnels.

Cette pratique est confrontée à de grands défis aujourd’hui, car certaines entreprises ont empêché l’accès du web scraper GPT développé par OpenAI aux données, telles que le New York Times et Fox Media.

De nombreuses organisations estiment que la formation de leurs données constitue une violation des droits d’auteur. Le New York Times a intenté une action en justice contre OpenAI et Microsoft pour violation des droits d’auteur, affirmant que ChatGPT et Copilot pourraient produire des sorties textuelles presque identiques à leur travail.

Tu pourrais aussi aimer

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accepter En savoir plus