#image_title

Des documents divulgués révèlent comment la recherche Google contrôle Internet

Recherche Google est souvent considéré comme la porte d’entrée d’Internet – c’est la première étape du parcours de la plupart des gens vers l’information en ligne. Cependant, Google ne dit pas grand-chose sur la manière dont il organise Internet, faisant de la recherche une boîte noire géante qui dicte ce que nous savons et ce que nous ignorons. Cette semaine, une fuite de 2 500 pages, signalée pour la première fois par un vétéran de l’optimisation des moteurs de recherche (SEO) Rand Fishkina donné au monde un aperçu du mystère vieux de 26 ans de la recherche Google.

Je pense que le plus important à retenir est que ce que disent les représentants publics de Google et ce que fait le moteur de recherche de Google sont deux choses différentes, a déclaré Fishkin dans une déclaration envoyée par courrier électronique à Gizmodo.

Ces documents donnent une vue plus détaillée de la manière dont la recherche Google contrôle les informations que nous consommons. Amener la bonne page Web sur votre ordinateur n’est pas une tâche passive puisque des milliers de décisions éditoriales sont prises en votre nom par un groupe secret de Googleurs. Pour le référencement, une industrie qui vit et meurt grâce aux algorithmes de Google, les documents divulgués sont un tremblement de terre. C’est comme si les arbitres de la NFL avaient réécrit les règles du football au milieu de la saison, et vous le découvrez en jouant au Super Bowl.

Plusieurs experts en référencement ont déclaré à Gizmodo que la fuite répertorie 14 000 fonctionnalités de classement qui, à tout le moins, définissent la façon dont Google organise tout sur le Web. Certains de ces facteurs incluent la détermination par Google de l’autorité d’un site Web sur un sujet donné, la taille du site Web ou le nombre de clics reçus par une page Web. Google a précédemment nié utiliser certaines de ces fonctionnalités de classement dans la recherche, mais la société a confirmé que ces documents sont réels, bien qu’imparfaits à ses yeux.

Nous mettons en garde contre les hypothèses inexactes sur la recherche basées sur des informations hors contexte, obsolètes ou incomplètes, a déclaré un porte-parole de Google dans un e-mail adressé à Gizmodo. Nous avons partagé de nombreuses informations sur le fonctionnement de la recherche et les types de facteurs pris en compte par nos systèmes, tout en nous efforçant de protéger l’intégrité de nos résultats contre toute manipulation.

En ce qui concerne la prudence de Google, la société ne confirmera pas ce qui est vrai ou non dans ces documents. Google dit qu’il est incorrect de supposer qu’il s’agit d’informations complètes sur la recherche et dit à Gizmodo que divulguer trop d’informations pourrait permettre à de mauvais acteurs. En fin de compte, nous ne savons pas ce qui entre dans la détermination de ces facteurs, ni quel poids la recherche Google accorde à chacun, le cas échéant.

Nous examinons simplement les différentes variables qu’ils envisagent, a déclaré Mike King, un expert SEO qui a été l’un des premiers à analyser la fuite, dans une interview avec Gizmodo. C’est la granularité dont [Google] regarde les sites Web.

Cette fuite a été remarquée pour la première fois par Erfan Azimi, un spécialiste du référencement qui a trouvé publiquement la documentation de l’API sur GitHub. On ne sait pas si ces documents ont réellement été divulgués ou publiés d’une manière ou d’une autre par Google dans un coin tranquille du Web, peut-être par accident. Azimi avait pour objectif de rendre publics ces documents en les apportant à Fishkin la semaine dernière, qui a demandé à King de l’aider à les comprendre.

King note qu’une fonctionnalité de classement homepagePagerankNs suggère que la notoriété de la page d’accueil d’un site Web pourrait soutenir tout ce qu’il publie. Fishkin écrit que la fuite fait référence à un système appelé NavBoost, référencé en premier par le vice-président de la recherche de Google, Pandu Nayak, dans son témoignage au ministère de la Justice, qui aurait prétendument mesure les clics pour améliorer le classement dans la recherche Google. De nombreux acteurs du secteur du référencement considèrent ces documents comme une confirmation de ce que l’industrie soupçonne depuis longtemps : un site Web jugé populaire par Google peut recevoir un classement de recherche plus élevé pour une requête, même si un site moins connu peut contenir de meilleures informations.

Ces derniers mois, plusieurs petits éditeurs ont vu leur trafic de recherche Google disparaître. Lorsque Nilay Patel de The Verges a interrogé le PDG de Google, Sundar Pichai, à ce sujet la semaine dernière, Pichai a déclaré qu’il il n’était pas clair s’il s’agissait d’une tendance uniforme. Une fonctionnalité de classement évoquée par King semble catégoriser ces petits sites de manière uniforme.

Ils ont une fonctionnalité appelée smallPersonalSite, et nous ne savons pas comment elle est utilisée bien sûr, mais c’est une indication que [Google] cherche à comprendre s’il s’agit de sites plus petits, a déclaré King. Étant donné qu’un si grand nombre de ces petits sites sont actuellement détruits, cela montre simplement que [Google] ne fait rien pour compenser les signaux de ces grandes marques.

Notamment, Pichai a mentionné plus tard dans cette interview avec The Verge qu’à d’autres moments, Google avait généré plus de trafic vers de petits sites. Ces fonctionnalités de classement pourraient indiquer les leviers que Google peut actionner. Alors que de plus en plus d’organisations médiatiques nationales autorisent l’affichage de leur contenu sur ChatGPT, la recherche Google semble également s’orienter vers les grands éditeurs. D’une manière générale, cela pourrait avoir un effet d’écrasement, en compressant ce que la plupart des gens entendent dans les seuls médias grand public.

Les effets d’entraînement de ces fuites de documents Google ont été largement ressentis. Kristen Ruby, PDG de Ruby Media Group qui travaille dans les relations publiques numériques et le référencement depuis plus de 15 ans, raconte à Gizmodo qu’elle a reçu un texte inquiétant lundi soir : la merde va mal avec Google demain.

Ruby a rapidement trouvé la fuite et a noté deux fonctionnalités de classement qui lui ont marqué : isElectionAuthority et isCovidLocalAuthority. Ces fonctionnalités semblent être le moyen utilisé par Google pour classer la crédibilité d’une page Web en ce qui concerne la fourniture d’informations appropriées sur les élections et le COVID-19, respectivement. En 2019, Ruby a beaucoup écrit sur comment Google mesure les pages Web dignes de confiance (que Google appelle MANGER, signifiant Expérience, Expertise, Autorité et Confiance) est intrinsèquement politique. Elle note que la mesure de ces facteurs par Google a tendance à être biaisée selon les lignes politiques.

Cela me pose problème que Google ne fournisse aucun contexte sur les éléments critiques des données tels que isElectionAuthority ou isCovidLocalAuthority. Comment Google définit-il une autorité dans ces domaines critiques ? Ruby a déclaré dans une déclaration envoyée par courrier électronique. Je ne devrais pas avoir à deviner quelle est la réponse. Google devrait être disponible et me dire quelle est la réponse.

Même si Google est une entreprise dotée d’un droit à l’information privée, Ruby soutient que Google a l’obligation de répondre aux questions sur ces fonctionnalités de classement qui façonnent le monde qui nous entoure. King et Fishkin ont également remarqué isCovidLocalAuthority et isElectionAuthority dans leurs articles sur la fuite, soulignant tous deux l’importance des moteurs de recherche pour améliorer la qualité des informations.

Je pense qu’il est très important qu’ils fournissent ce genre de discernement en matière d’information, car que cela nous plaise ou non, Google est effectivement un service public, a déclaré King. Ils me repoussent probablement en disant cela, mais nous le considérons comme la principale source d’information sur le Web.

La façon dont Google classe les informations dans ces exemples est un microcosme de l’ensemble de l’écosystème de recherche. Chaque jour, des millions de questions se posent sur les informations à amplifier et celles à réduire au silence. Alors que Google et plusieurs entreprises technologiques tentent depuis longtemps de se présenter comme des algorithmes sans opinion, ces fonctionnalités de classement montrent que ce n’est pas tout à fait le cas. Il existe de nombreux autres exemples de fonctionnalités de classement révélés dans la fuite de 2 500 pages.

Recherche de réponses au milieu de l’algorithme de Google

Étant donné que Google ne développera pas ces documents, disant à Gizmodo que divulguer trop d’informations pourrait permettre à de mauvais acteurs, les experts en référencement doivent donner un sens à cela au nom de tous ceux qui utilisent la recherche Google. Plusieurs de ces 14 000 fonctionnalités de classement identifiées la semaine dernière sont des éléments que Google a explicitement affirmé ne pas avoir utilisés au fil des ans.

Dans une vidéo de 2016, un représentant de la recherche Google a déclaré : Nous Je n’ai pas de score d’autorité de site Web. Dans une interview de 2015, un autre Googleur a déclaré : Utiliser les clics directement dans le classement serait une erreur. Il est difficile de donner un sens à ces commentaires à la lumière des documents divulgués et de la réponse de Google.

Cette réponse est un exemple parfait de la raison pour laquelle les gens n’aiment pas ou ne font pas confiance à Google, a déclaré Fishkin. Il s’agit d’une non-déclaration qui ne répond pas à la fuite, n’apporte aucune valeur et pourrait très bien avoir été écrite par une IA formée sur la messagerie d’entreprise la plus sans âme des dernières décennies.

À l’ère des réponses basées sur l’IA, Ruby note que la façon dont Google classe les pages Web est plus importante que jamais. Au lieu d’une série de liens vers diverses perspectives, vous pourriez obtenir une réponse claire grâce à Les nouveaux aperçus de l’IA de Google. Cependant, nous avons vu des publications Reddit vieilles de 10 ans acquérir d’étranges niveaux d’autorité, demandant à certains utilisateurs de mettre coller dans leur pizza. La façon dont Google choisit l’autorité est de plus en plus importante, car le premier résultat est peut-être le seul à avoir désormais une voix.

Nous changeons de vitesse. Nous passons d’un système de recherche à un autre, a déclaré Ruby. L’IA a un impact profond sur les résultats de recherche.

En fin de compte, il est difficile de dire ce que Google fait réellement avec ces fonctionnalités de classement. Ce qui est clair, c’est que Google a créé ces classificateurs, et en a potentiellement encore plus, pour classer les sites Web sur Internet. Ces classements nécessitent clairement des jugements, ajoutant davantage de preuves que la recherche Google n’est pas une expérience objective, mais plutôt une série de choix éditoriaux faits par des personnes au sein de Google.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite