Vous obtenez l’Internet que vous méritez
Commentaire Pour voir où se dirige ce camion à benne basculante, suivons d’abord la piste des débris.
Il est difficile de remonter la piste, mais les impacts des usines de contenu Internet, qui ont prospéré jusqu’en 2010 environ, sont toujours visibles.
L’effet net du contenu généré au rythme de dix à trente pièces par jour sur des sujets spécialisés, le tout entre les mains de non-spécialistes via la main directrice de Google Trends, a conduit à un Internet qui, en 2010, était saturé de peluches (sinon absurdes ), des articles bourrés de mots clés qui offraient peu d’informations utilisables et, dans de nombreux cas, de nombreux conseils et informations tout simplement incorrects.
Et parce que les moulins à contenu ont naturellement engendré plus de moulins à contenu (et pourquoi pas lorsque le pire contenu associé vendu à Yahoo! pour 100 millions de dollars), ce qui s’est passé ensuite était inévitable. Ces nouvelles sociétés de contenu ont simplement reproduit ce qu’elles ont trouvé sur de plus grands moulins à contenu, en utilisant Internet de l’époque comme un ensemble de formation, pour ainsi dire. Le cycle des mauvais articles avec peu de détails ou pire, des détails inexacts, s’est répété encore et encore jusqu’à ce qu’il devienne difficile de distinguer un article du suivant à moins qu’il ne soit trouvé sur l’un des rares sites édités et réputés.
Le nom du jeu pour ces premières sociétés de contenu était pur volume. Les revenus des réseaux publicitaires (Google Adsense, etc.) étaient déjà en baisse en 2005, mais avec des milliers, voire des millions d’articles, chacun générant peut-être trois cents par jour, l’argent n’était pas mauvais. Pour une usine de contenu avec 200 000 articles, il s’agissait d’une entreprise bien rangée de 2 millions de dollars avec des frais généraux ultra-faibles. L’hébergement n’était pas extrêmement coûteux, la conception Web était facile avec des outils CMS open source tels que WordPress, Drupal et autres, et le plus important (et finalement le plus désastreux), le contenu en vrac pouvait être acheté pour seulement quelques centimes par article dans des magasins offshore.
Ce modèle signifiait qu’Internet était rapidement inondé d’absurdités mal écrites, dont une grande partie est encore consultable sous sa forme originale ou encore plus mal remaniée. Google a dû commencer à intensifier son jeu pour filtrer autour de cela et apprendre à fournir un contenu de qualité par rapport au mélange magique de mots-clés que les usines de contenu pourraient exploiter.
Les problèmes avec les moulins à contenu sont clairs, surtout toutes ces années plus tard, mais tout était à l’échelle humaine avec les limites des rédacteurs « lents » et des bourreurs de mots clés. L’avenir nous présente une nouvelle matière qui pourrait bouleverser la façon dont nous utilisons Internet pour de bon.
Faisons un peu de calcul
Imaginez que nous sommes en 2006 et que vous êtes dans l’industrie du contenu. Vous êtes au sommet de votre art. Vous avez une équipe de 100 rédacteurs en Inde qui gagnent l’équivalent de 10 $ par jour pour écrire et publier vingt articles de 400 mots (sujets dictés par les données de tendance des mots clés de Google par rapport à l’expertise, etc.).
Vos coûts quotidiens pour le salaire sont d’environ 1 000 $. Chaque jour, votre moulin à contenu publie 2 000 éléments de contenu « unique » 365 jours par an, et chacun de ces articles, en supposant un bon classement dans les moteurs de recherche (qui pouvait être facilement joué avec des astuces de mots clés à l’époque), chacun de ces articles générera trois cents par jour.
Et pendant que nous utilisons des chiffres agréables et arrondis pour plus de facilité, considérez ces chiffres annuels (annuels car vous n’avez besoin de gérer cette entreprise que pendant un an, l’argent Adsense rentre quoi qu’il arrive, au moins pendant un certain temps):
Le salaire des rédacteurs qui créent, publient et marquent 20 articles par jour vous coûte 365 000 $ par an. Ils génèrent 730 000 éléments de contenu d’une valeur de 10,95 $ par élément au cours de l’année (en supposant trois cents par jour pendant 365 jours). Et tout cela, ce qui est plutôt pratique pour vous, Western Content Lord, signifie que vous avez une entreprise générant environ 8 millions de dollars par an.
Oh. Mais vous devez soustraire l’hébergement et autres. Appelons ça cinq mille dollars. Le gros coût laid? Tous ces écrivains « chers ». Et tu penses à toi-même, qui en a besoin?
Eh bien, non.
Parce que oh boy, y a-t-il un nouveau modèle commercial pour les moulins à contenu. Et tandis que leurs prédécesseurs du début des années 2000 rendaient Internet ennuyeux et plein d’articles indésirables qui atteignaient les objectifs de mots clés et de nombre de mots sans rien dire du tout, celui-ci est suffisamment perturbateur pour transformer Internet en poubelle complète. Et pas seulement du point de vue du contenu, mais aussi du point de vue du fonctionnement de l’entreprise sur Internet.
Mettre le S dans iOS
Ce nouveau business model est déjà en train de se déployer. Vous avez probablement lu de nombreux articles générés par GPT ou des modèles d’IA similaires. La raison pour laquelle vous ne l’avez probablement pas remarqué est qu’ils ne sont pas mauvais. Bien toi penser ils ne sont pas mauvais, mais c’est parce que vous avez été sevrés sur l’Internet de merde (IoS) que les usines de contenu ont provoqué, ce qui nous a entraînés à réduire nos attentes en matière de consommation d’informations.
Le problème est que ces articles générés par l’IA doivent obtenir leurs informations quelque part dans un volume suffisant pour produire de manière appropriée de nouveaux clones d’informations masqués dans un langage légèrement plus éloquent. Et d’où viennent les algorithmes d’entraînement de l’IA ? De l’iOS, bien sûr.
Si nous faisons plus de calculs, supposons que 10 % des données de formation dérivées d’IoS contiennent des erreurs factuelles. Au fur et à mesure que l’IA s’entraîne, puis se recycle et se recycle, ces erreurs augmentent. Et monter. Et multipliez et dans une décennie de recyclage sur des données mauvaises, bizarres, bizarrement formulées et de plus en plus incompréhensibles, nous nous retrouvons avec un véritable IoS.
Et les maths sont à nouveau super importantes, tout comme le volume.
Un seul opérateur de moulin à contenu à l’échelle de Western Content Lord, par exemple, peut utiliser des outils gratuits pour générer du contenu aussi rapidement que les opérateurs humains peuvent le brancher avec une simple phrase d’incitation. Cette même équipe de 100 travailleurs peut entrer 300 pièces par jour.
Ils ne l’écrivent pas, ils demandent juste ChatGPT. Ils peuvent lui demander de le remplir de mots-clés comme un mofo et de générer également des mots-clés, d’ailleurs. Finalement, ce processus de ChatGPT (comme l’un des nombreux exemples) aura des crochets d’API pour publier la sortie directement sur WordPress ou tout ce que CMS Content Lord choisit.
Lorsque cette unification de la plate-forme IA vers CMS est terminée, la boucle est bouclée : Internet ne fait que parler tout seul.
La course vers le bas
Ce que Western Content Lord et ses concurrents ne réalisent pas, c’est à quelle vitesse cette course vers le bas va commencer et bientôt.
Google Adsense et tous les autres réseaux publicitaires de la planète reconnaîtront le déluge et réduiront à presque rien ce qu’il paie pour un clic ou une vue. Et puis ce ne sera rien, mais pas avant que Google et ses semblables ne se bousculent pour mettre sur liste noire les usines de contenu d’IA connues. Mais il y en aura trop qui apparaîtront trop rapidement. Il sera juste plus facile pour un Google, par exemple, de créer une liste sûre d’éditeurs connus soutenus par des humains laborieux.
Super, tu penses, l’équilibre est rétabli! Pas tellement.
Suivre toutes les innovations en matière de recherche qui poussent ces résultats IoS vers le bas pour vous coûtera de l’argent à Google, une formation à l’IA à des échelles d’un milliard de dollars et un recyclage considérable et fréquent sur le corpus d’Internet. Ce corpus sera infecté rapidement et furieusement et comment les géants de la recherche paient-ils pour toute cette innovation de recherche ? Via les revenus publicitaires.
Les géants de la publicité de recherche comme Google pourraient sembler se boucher le nez et accepter les résultats de l’usine de contenu dans la file d’attente parce que c’est dans leur intérêt économique de le faire. Mais que se passe-t-il si le pool de contenu « acceptable » diminue de 95 % ?
Le taux exponentiel de shittification d’Internet
Nous revenons à nouveau sur le thème des mathématiques et du volume et autres pour aborder le point le plus important : le danger de l’information est un problème exponentiel. Une série d’erreurs générées, puis répétées par les usines de contenu pendant une décennie, signifie que ces problèmes sont formés dans le modèle de langage de base de l’IA à partir du corpus d’Internet et renforcés.
C’est une chose de vivre à l’ère des fausses nouvelles, en partie parce que pour la plupart des gens qui réfléchissent, c’est évidemment faux. Quand Internet répète une erreur assez souvent, cela devient la vérité et c’est le résultat accidentel le plus insidieux de tout cela.
Personnellement, cela me ferait me sentir mieux de terminer cette pièce avec une sorte de message de « combattre le pouvoir », mais honnêtement, à ce stade, le chat est sorti du sac. Les usines de contenu peuvent se contenter de revenus par article mesurés sur un plan de valeur sur cinq ans et pouvant ne représenter que 0,05 centime sur la durée. Mais qui s’en soucie, non? C’est de l’argent gratuit. L’hébergement est bon marché, un CMS est gratuit et tant qu’il y a de l’argent publicitaire, cela en vaut la peine.
C’est l’internet que vous méritez, apparemment.