Duplicate Content : Qu’est-ce que le duplicate content ?

Qu’est-ce que le Duplicate Content ?

Le Duplicate content qui veut dire en français « contenu dupliqué » évoque le contenu d’une page web ou d’un site internet qui est reproduit à l’identique ou presque sur le Web. C’est un phénomène qui pose un problème en matière de référencement, car les moteurs de recherche traquent et sanctionnent les pages ou sites concernés par le duplicate content.

Le duplicate content s’assimile à du copié-collé de contenus sur des URLs différents

Cela peut être un contenu textuel seul sur un paragraphe ou un contenu textuel avec d’autres éléments sur toute une page. Lorsqu’un tel contenu est repris pour être publié sur une autre URL, sans ou avec une légère modification, il est considéré comme du duplicate content et c’est le moteur de recherche qui fait ce « jugement ». Il existe deux types de contenu dupliqué.

Le premier concerne les pages dupliquées à l’intérieur d’un même site, sur des URLs différentes donc, dues soit à la nécessite de faire séparément une version desktop et une version mobile d’un site, soit à cause d’une erreur technique ou du webmaster. Là, les contenus sont parfaitement identiques. Cela arrive souvent sur les e-boutiques avec leurs fiches produits. Le second concerne les pages dupliquées sur des sites différents.

Il peut être le fruit d’une redistribution de flux RSS ou celui d’une description quasi identique d’un produit similaire ou tout simplement le fait d’un plagiat. C’est un phénomène vraiment craint des propriétaires de sites web. Il arrive toutefois qu’il soit intentionnel, parce que nécessaire, de laisser les contenus dupliqués persister, dans lequel cas, il suffit d’indiquer le contenu source au robot de Google par l’utilisation de la balise rel=canonical et c’est la page considérée comme originale qui sera indexée.

Le Duplicate content est gênant pour le référencement d’une page sur un moteur de recherche

Il faut d’abord savoir que sauf dans les plus sévères des cas, le phénomène de contenu dupliqué n’empêche pas le moteur de recherche Google d’indexer les pages concernées. Google essaie juste de ne pas surclasser un site en prenant en compte le même contenu plusieurs fois.

Ce qui arrive aux pages classées en duplicate content, c’est de perdre des positions dans les SERP, voire d’être retirées des résultats de recherche. Il arrive aussi quand même à une page originale d’être reléguée au second plan au profit du voleur de contenu quand le PageRank de ce dernier est plus fort. À part les 2 types de duplicate content, il y a 3 cas.

Le premier se rapporte aux pages strictement identiques. Là, seule celle qui a le plus fort PageRank sera indexée.

Le deuxième se rapporte aux pages similaires, mais différenciées par leurs balises Title et Description. Là, toutes les pages seront indexées, mais celles qui ne sont pas considérées comme l’originale n’apparaîtront aux SERP qu’en cliquant sur « relancer la recherche en incluant les pages ignorées ».

Le troisième concerne les balises Title et Description identiques pour des pages différentes. Là, Google peut aller jusqu’à ne pas indexer les pages considérées dupliquées. Les règles à retenir, c’est : une page = une URL distincte et en cas de contenu dupliqué volontairement, mettre l’URL de la page originale dans la balise canonical.

Pendant que vous lisez ces lignes, vos concurrents gagnent du terrain : demandez dès maintenant votre plan d’action SEO.

Contactez-nous

Comment détecter le contenu en double ?

Il existe plusieurs outils pour détecter le contenu en double sur votre site web. Le plus simple est d’utiliser l’outil de recherche de Google. Vous pouvez saisir une phrase de votre contenu dans la barre de recherche de Google et voir si les mêmes résultats apparaissent sur plusieurs pages de votre site web. Vous pouvez également utiliser des outils tels que Copyscape, qui vous permet de rechercher du contenu en double sur votre site web.

Comment éviter le contenu en double ?

La meilleure façon d’éviter le contenu en double est de créer un contenu unique et original pour chaque page de votre site web. Assurez-vous de ne pas copier-coller du contenu d’une page à l’autre et de créer des titres et des descriptions uniques pour chaque page. Si vous avez besoin d’utiliser le même contenu sur plusieurs pages, assurez-vous de le réécrire en utilisant des variations de mots-clés.

Définition du Duplicate Content

Résumé et points clés de l’article

Qu’est-ce que le Duplicate Content ?

Le duplicate content s’assimile à du copié-collé de contenus sur des URLs différents

Le Duplicate content est gênant pour le référencement d’une page sur un moteur de recherche

Comment détecter le contenu en double ?

Comment éviter le contenu en double ?