Tous les sites web sont sujets aux problématiques de Duplicate Content. Ce phénomène peut en effet se manifester sous plusieurs formes dont une des plus connues et des plus courantes est le DUST (Duplicate Content, Same Text). Or la solution de ce problème est très facile comme vous allez le découvrir.
Qu’est-ce que le DUST ?
Comme on a dit, le DUST (Duplicate Content, Same Texte) est un problème de Duplicate Content courant sur les sites web. Il signifie qu’une même page web est identifiable depuis plusieurs URLs. C’est-à-dire que pour un seul et unique code source, différentes URLs sont utilisées.
Prenons l’exemple d’un site web appelé Monsite. L’internaute peut accéder à la page d’accueil du site via l’adresse http://www.monsite.com/. Mais il peut également y accéder via différents liens internes et externes :
- http://www.monsite.com
- http://monsite.com/
- monsite.com
- monsite.com/
- http://www.monsite.com/accueil
- http://www.monsite.com/index.php
- etc.
Il ne s’agira pas uniquement des liens que vous créez vous-même, mais aussi de liens externes pointant vers votre site. Et comme il n’est pas possible de contrôler la manière dont les autres sites formulent les liens vers le vôtre, les possibilités du DUST deviennent très nombreuses.
Pourquoi le DUST est-il dangereux ?
Le danger du DUST dérive du fonctionnement des moteurs de recherche. L’URL est en effet le paramètre ou référenciel choisi par les moteurs de recherche. S’ils trouvent qu’une page web est identifiable via plusieurs URL, ils ne savent pas laquelle choisir. Ils considèrent donc qu’il s’agit de plusieurs pages différentes et crée du contenu dupliqué intrasite.
Le DUST influence le référencement du site et implique une perte importante du trafic. Il influence également la pertinence des résultats aux yeux des internautes.
Comment résoudre le problème du DUST ?
Une solution simple et facile à mettre en œuvre permet d’éviter le DUST sur un site web. Il s’agit d’utiliser une balise canonical pour l’URL que le moteur de recherche doit prendre en compte. Cette balise indique au moteur de recherche que parmi les nombreuses pages similaires (les différentes URL), c’est cette URL qui doit être prise en compte.
La base canonical est introduite de la manière suivante :
<link rel= »canonical » href= »https://www.monsite.com/ »>
De ce fait, le moteur de recherche saura que cette URL canonique est la seule qu’il doit prendre en compte pour l’indexation et qu’il doit faire apparaître dans les résultats de recherche. Même s’il arrive au même code source via une autre URL, la balise canonical lui rappellera que c’est l’URL canonique qu’il doit considérer. De même, le moteur de recherche transférera de manière automatique les Backlinks dont l’URL est différente vers l’URL canonique.
Le DUST est un problème fréquent sur les sites où le CMS génère automatiquement des URLs pour de nouvelles pages (l’ajout de nouveaux produits sur un site e-commerce par exemple). L’utilisation de la base canonical est recommandée dans ce cas.
On rappelle que la base canonical est ajoutée automatiquement pour les pages dupliquées sur WordPress, ceci grâce à l’extension Yoast.
Outre la base canonical, le problème du DUST peut être résolu grâce à la redirection 301. Les deux solutions permettent de résoudre le problème, mais réagissent différemment sur le trafic et le référencement du site.