PageRank - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs est disponible ici.

Le PageRank (terme anglais signifiant " classement d'une page ") ou PR désigne le système de classement des pages Web utilisé par le moteur de recherche Google pour attribuer l'ordre des liens dans les résultats de recherche. Le mot PageRank fait aussi référence à Larry Page cofondateur de Google et inventeur de ce principe. Ce mot est une marque déposée.

Fonctionnement

Google affecte un score à chaque page Web. Cette note est attribuée en fonction de nombreux critères et principalement en fonction des liens externes (popularité de liens) pointant vers elle, ainsi que des liens qu'elle fait vers elle-même (liens internes).

L'algorithme du PageRank basé sur les liens était à l'origine le moyen utilisé par Google pour donner une note aux pages. Mais, comme cela est décrit dans le brevet déposé le 17 avril 2007[1], de nombreux autres critères sont maintenant pris en compte.

Le PageRank réel d'une page n'est connu que de Google, même si l'on peut penser qu'il suit les principes du brevet. Les internautes peuvent obtenir une approximation du classement de la page en consultant la zone PageRank de la Google Toolbar, qui indique sa valeur sur une échelle de 0 à 10 (Échelle logarithmique). Il existe aussi de nombreux outils pour l'obtenir sans afficher la toolbar.

La course aux liens

Les référenceurs et les webmestres créent quelquefois massivement des liens retour, par échanges de liens ou en inscrivant un site sur une quantité d'annuaires. Google avait autrefois une vision quantitative de la popularité d'une page, cette technique permettait donc de gonfler artificiellement son indice de popularité. Mais Google a réagi : d'une part en instaurant des filtres, tels que la Sandbox. Il détecte et sanctionne les campagnes massives de liens artificiels ; par ailleurs il intègre des critères qualitatifs à l'analyse des liens (sémantique, confiance : indice TrustRank, comportement des utilisateurs.

Principaux critères du score d'une page

Selon le brevet Google, ces critères sont :

  • les liens entrants et sortants ;
  • les ancres ;
  • le trafic associé à la page ;
  • le comportement de lecteurs : le choix de la page dans les résultats ;
  • le nom de domaine ;
  • l'hébergement.

Le Trustrank

C'est un critère d'autorité accordé aux pages, du fait que l'auteur dispose d'une qualité de sérieux, de compétence reconnus. Ce critère est associé aux sites gouvernementaux, et aux sites de référence tels le W3C.

nofollow

La valeur nofollow de l'attribut HTML rel a été définie par Google en 2005, hors des processus normatifs du W3C. Selon Google, un lien ainsi qualifié dans une page Web n'entre pas en compte dans l'algorithme de calcul de pageRank [2].

Futur PageRank

Beaucoup d'outils proposent de calculer le futur classement d'une page après le prochain passage du googlebot. Ces outils ne sont pas fiables car ils se basent uniquement sur la valeur RK du checksum de Google. L'utilité de cette donnée n'est connue que de Google et n'a rien à voir avec un futur Page Rank.

Un escalator sous l'océan
Il y a 18 heures
Page générée en 0.032 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise