Étude et article réalisés par Mehdi Collin.
Le 10/09/2019, Google annonçait deux nouvelles valeurs pour l’attribut rel afin de décrire nos liens nofollow de manière plus précise. (source: https://developers.google.com/search/blog/2019/09/evolving-nofollow-new-ways-to-identify).
Revenons sur ce sujet anodin en apparence car il a suscité beaucoup de réactions négatives et permet de revenir sur plusieurs notions importantes.
L’origine du nofollow
En Janvier 2005, Google annonce la prise en compte de la valeur nofollow pour l’attribut de lien rel (https://googleblog.blogspot.com/2005/01/preventing-comment-spam.html). Cet attribut permet de prévenir le spam. En effet de nombreux blogs, forums et autre site web permettant l’ugc (contenu généré par l’utilisateur) se trouvent envahis de messages publicitaires avec des liens. L’objectif de ce spam n’est pas de promouvoir directement ces URLs au sein des sites cibles où ils sont publiés, mais de gagner en visibilité indirectement sur les moteurs de recherches en drainant du Pagerank.
L’attribut rel= »nofollow » permet d’empêcher la prise en compte du lien. Ce balisage constitue une mesure dissuasive envers d’éventuels spammeurs.
À noter aussi que l’appellation Nofollow (« ne pas suivre) n’est pas bien clair. Ici, il est surtout question de non prise en compte du lien dans l’algorithme de ranking. Pour ce qui est du suivi par Googlebot, en faisant quelques recherches, on tombe sur des tests aux résultats contradictoires sur le sujet. Nous n’avons pas pris le temps de refaire le test en interne, mais il est évident que cet attribut n’est pas la solution pour optimiser les passages du Googlebot malgré ce nom ambigu.
Controverse Wikipédia
Wikipedia annonce implémenter ce balisage à partir de 2007 pour décourager le spam dont il fait souvent l’objet. On comprends l’intérêt pratique, néanmoins, s’en est suivi une controverse de webmasters considérant que c’est contraire au principe de base de la réciprocité des liens Internet. L’écrivain Nicolas Charr ira jusqu’à dire que Wikipédia est devenu un trou noir sur internet absorbant énormément d’énergie sans jamais rien redistribuer (https://web.archive.org/web/20080205035136/http://www.roughtype.com/archives/2007/01/is_wikipedia_a.php).
Nofollow et liens publicitaires
Le second intérêt du nofollow, c’est de pouvoir indiquer à Google de ne pas prendre en compte les liens publicitaires. L’achat de liens est contraire aux guidelines de Google (source : https://developers.google.com/search/docs/advanced/guidelines/link-schemes?hl=fr).
En réalité c’est plutôt l’achat de link juice qui est contraire aux règles de Google. Le seul endroit où Google vous autorise à obtenir de sa visibilité en payant, c’est sa régie Google Ads. Néanmoins, pour ne pas risquer d’être pénalisé lorsque vous souhaitez acheter un espace publicitaire légitimement sur un site tiers, il est possible de le faire dès lors que le lien est en nofollow. Ainsi vous bénéficiez bien de la visibilité du site qui vous fait le lien mais sans court-circuiter l’algorithme du moteur.
NLDR : Notons toutefois que les campagnes de netlinking sont très populaires, avec énormément de plateformes qui fleurissent années après années et des résultats mécaniques. C’est d’ailleurs bien parce que cette stratégie fonctionne que Google souhaite en dissuader l’utilisation. Il reste difficile pour lui de détecter automatiquement si un lien est frauduleux (du point de vues de ses guidelines) ou non.
C’est quoi le pagerank sculpting ?
L’idée de base du pagerank sculpting est de pouvoir optimiser la distribution du pagerank via le maillage interne. Idéalement, il serait très intéressant de supprimer certains liens pour ne pas rediriger trop de pagerank sur des pages non stratégiques.
Néanmoins, il peut y avoir un conflit d’intérêt entre des considérations UX, juridique et SEO. Par exemple : un lien vers les CGU du site. Pour concilier ces problématiques, le hack populaire qui a été trouvé consiste à mettre en nofollow les liens que l’on souhaites cacher auprès de Google. Ceci permet de garder le lien pour les utilisateurs tout en maitrisant la distribution de pagerank.
Néanmoins, le nofollow n’a pas été pensé à cet effet, et l’idée d’avoir un maillage SEO qui ne correspond pas à ce que voit réellement l’utilisateur est problématique pour Google. Matt Cutts nous explique en 2009 en quoi les règles du jeux ont changé pour dissuader ce genre de pratiques .
« Que se passe-t-il donc lorsque vous avez une page avec « dix points de PageRank » et dix liens sortants, et que cinq de ces liens ne sont pas suivis ? Laissons de côté le facteur de décroissance pour nous concentrer sur le cœur de la question. À l’origine, les cinq liens sans nofollow auraient donné deux points de PageRank chacun (en fait, les liens nofollow ne comptaient pas dans le dénominateur lorsqu’on divisait le PageRank par le degré de la page). Il y a plus d’un an, Google a modifié la façon dont le PageRank s’écoule, de sorte que les cinq liens sans nofollow s’écoulent chacun d’un point de PageRank. »
Traduction de https://www.mattcutts.com/blog/pagerank-sculpting/
En d’autre termes, lorsque vous ajoutez un lien nofollow, vous ne lui envoyez toujours pas de pagerank. En revanche, vous n’en économisez pas non plus. Un lien nofollow, c’est un peu de pagerank jeté à la poubelle. Donc utiliser le nofollow pour faire du pagerank sculpting est évidement proscrit depuis.
Pour autant, cela n’induit pas la fin du pagerank sculpting, il reste possible via des techniques d’obfuscation ou encore du cloaking pour les plus radicaux.
Passage à Sponsored/Ugc et polémiques
La dernière nouveauté en date, c’est le passage de la valeur nofollow aux nouvelles valeurs sponsored et ugc (https://developers.google.com/search/docs/advanced/appearance/qualify-outbound-links?hl=fr).
En réalité, il existe toujours la possibilité d’utiliser le rel= »nofollow » pour que ce soit rétroactif mais Google encourage à utiliser des valeurs plus précises pour différencier les liens sponsorisés des liens UGC (les deux raisons d’utiliser le nofollow expliqué précédemment).
Il s’en est suivi de vives réactions. Globalement les deux points qui remontaient, étaient les suivants :
Google fait ça pour mieux cibler les sites qui font des liens sponsorisés et éventuellement les pénaliser.
Quand on parle de liens sponsorisés, il en existe deux types.
Premier cas : Je souhaite acheter de la visibilité sur un site tiers.
Dans ce cas, de la même manière qu’on vous demandait un lien nofollow, là vous pourriez utiliser la valeur sponsored à la place. Il n’y a aucune raison d’être pénalisé pour cela, la seule chose c’est que Google ne fera pas suivre le pagerank (comme pour le nofollow).
Deuxième cas : Les liens sponsorisés pour le SEO.
Comme expliqué précédemment, ces liens sont en effet contraires aux guidelines de Google et peuvent être pénalisés (encore faut-il que Google puisse le détecter).
Vu que ces liens sont sciemment fait pour paraitre naturels aux yeux de Google, de la même manière qu’on s’abstenait d’indiquer la valeur nofollow, on s’abstiendra évidemment d’indiquer la valeur sponsored ! Ici aussi, difficile d’imaginer une différence sur l’efficacité du netlinking ou de la capacité de Google à les détecter.
Deuxième point : On donne trop d’informations à Google !
N’est-ce pas le propre du SEO que de décrire au mieux notre site web pour que Google (et d’autres) puisse le comprendre ?
- On s’assure d’utiliser un balisage html correct pour avoir une structure html compréhensible
- On s’assure avoir nos pages indexables et correctement maillées pour que Googlebot puisse les trouver facilement.
- On s’assure d’avoir des titres limpides pour que Google indexe correctement le contenu.
- On ajoute des micro-données au sein de pages pour donner des éléments de contextes supplémentaires.
En ce sens les valeurs ugc/sponsored enrichissent simplement notre vocabulaire pour décrire avec encore plus de précision nos contenus.
En outre, de la même manière qu’avant, là ou nous souhaitons sciemment ne pas communiquer certaines informations à Google, nous pouvons continuer de ne pas le faire.
Aussi, nous souhaitons faire le lien avec html et sa logique. Quelles sont les bonne pratique html pour ne pas rester focaliser sur une angle de vue purement SEO ?
C’est quoi le html ?
Le html est historiquement le langage qui vous permet de créer des pages web. Globalement, dès qu’une page web s’affiche sur votre, écran, c’est du html interprété par votre navigateur. Que votre site soit un WordPress avec une base php ou basé sur un quelconque framework JS, in fine, c’est du html qui s’affichera sur votre navigateur.
Historiquement, nous avions certaines balises comme <b> et <i> qui permettaient respectivement de mettre du texte en gras et en italique. Avec l’arrivé du CSS dans les années 90 et l’arrivée de nouveau balisage, le html a fini par devenir un langage uniquement descriptif.
Ce qu’il faut comprendre par là, c’est que le html ne doit pas dire si un texte est en gras (<b>) mais s’il est important (<strong>). Il ne s’agit donc pas de donner des instructions sur l’interprétation d’un élément par le navigateur mais d’en décrire le sens (on parle ici de balise sémantique).
Le html est une langage descriptif.
Pour la petite anecdote, historiquement on utilisait des tableaux (balise <table>) pour structurer la mise en page d’un site web. Ce mode d’intégration n’est plus une bonne pratique puisqu’on détourne l’élément table qui est censé décrire un réel tableau d’informations et ne doit pas être utilisé à des fins esthétiques. Aujourd’hui, avec l’émergence de framework CSS comme Bootstrap, on utilise des systèmes de grilles pour intégrer, ce qui correspond à reprendre en grande partie la logique des tableaux qui est terriblement efficace d’un point de vue pratique ! Néanmoins, l’utilisation des grilles en CSS nous permet de ne pas utiliser l’élément table pour avoir un code html correct et respecter la sémantique des balises.
Dans le cas du nofollow on ne décrit rien, on donne une instruction d’interprétation. Dans le cas des valeurs telles que sponsored et ugc, on ne donne plus d’instructions, on décrit directement notre contenu.
Selon nous, c’est une meilleure pratique et une manière bien plus élégante de produire du html.
Conclusion
En définitive, ces valeurs nous aident à mieux décrire nos contenus tout en nous débarrassant de l’ambiguïté du nofollow. S’il n’est pas toujours utile de les utiliser, de nouveaux outils sémantiques sont toujours bienvenus.
0 commentaires