Définition du Duplicate Content

Agence SEO.fr > Définition – Les termes du référencement > Définition du Duplicate Content

Qu’est-ce que le Duplicate Content ?

Le Duplicate content qui veut dire en français « contenu dupliqué » évoque le contenu d’une page web ou d’un site internet qui est reproduit à l’identique ou presque sur le Web. C’est un phénomène qui pose problème en matière de référencement car les moteurs de recherche traquent et sanctionnent les pages ou sites concernés par le duplicate content.

Le duplicate content s’assimile à du copié-collé de contenus sur des URLs différents

Cela peut être un contenu textuel seul sur un paragraphe ou un contenu textuel avec d’autres éléments sur toute une page. Lorsqu’un tel contenu est repris pour être publié sur une autre URL, sans ou avec une légère modification, il est considéré comme du duplicate content et c’est le moteur de recherche qui fait ce « jugement ». Il existe deux types de contenu dupliqué.

Le premier concerne les pages dupliquées à l’intérieur d’un même site, sur des URLs différentes donc, dues soit à la nécessite de faire séparément une version desktop et une version mobile d’un site, soit à cause d’une erreur technique ou du webmaster. Là, les contenus sont parfaitement identiques. Cela arrive souvent sur les e-boutiques avec leurs fiches produits. Le second concerne les pages dupliquées sur des sites différents.

Il peut être le fruit d’une redistribution de flux RSS ou celui d’une description quasi identique d’un produit similaire ou tout simplement le fait d’un plagiat. C’est un phénomène très craint des propriétaires de sites web. Il arrive toutefois qu’il soit intentionnel, parce que nécessaire, de laisser les contenus dupliqués persister, dans lequel cas il suffit d’indiquer le contenu source au robot de Google par la l’utilisation de la balise rel=canonical et c’est la page considérée comme originale qui sera indexée.

Le Duplicate content est gênant pour le référencement d’une page sur un moteur de recherche

Il faut d’abord savoir que sauf dans les plus sévères des cas, le phénomène de contenu dupliqué n’empêche pas le moteur de recherche Google d’indexer les pages concernées. Google essaie juste de ne pas surclasser un site en prenant en compte le même contenu plusieurs fois.

Ce qui arrive aux pages classées en duplicate content, c’est de perdre des positions dans les SERP, voire d’être retirées des résultats de recherche. Il arrive aussi quand même à une page originale d’être reléguée au second plan au profit du voleur de contenu quand le PageRank de ce dernier est plus fort. A part les 2 types de duplicate content, il y a 3 cas.

Le premier se rapporte aux pages strictement identiques. Là, seule celle qui a le plus fort PageRank sera indexée.

Le deuxième se rapporte aux pages similaires mais différenciées par leurs balises Title et Description. Là, toutes les pages seront indexées mais celles qui ne sont pas considérées comme l’originale n’apparaîtront aux SERP qu’en cliquant sur « relancer la recherche en incluant les pages ignorées ».

Le troisième concerne les balises Title et Description identiques pour des pages différentes. Là, Google peut aller jusqu’à ne pas indexer les pages considérées dupliquées. Les règles à retenir, c’est : une page = une URL distincte et en cas de contenu dupliqué volontairement, mettre l’URL de la page originale dans la balise canonical.

Image par Free-Photos de https://pixabay.com

Vous souhaitez en apprendre plus ?

Rejoignez nos formations pour devenir un professionnel du SEO !

Nos formations
Vous souhaitez travailler avec cette équipe ? Nous sommes prêts !