Définition Noindex

Qu’est-ce que Noindex ?

NoIndex est une instruction SEO qui ordonne aux robots des moteurs de recherche de ne pas indexer la page web qui la contient. Certaines pages n’ont en effet aucun intérêt à être indexées. La mise en place de cette instruction se fait directement dans le code HTML de la page, et plus précisément dans la balise meta « robots ».

Les webmasters utilisent le Noindex pour empêcher l’indexation des pages

Il y a plusieurs raisons qui font que des pages web n’ont pas à apparaître dans les pages de résultats de recherche (les SERP) et donc à être indexées. Cela peut être parce qu’il s’agit de pages de PDF, parce qu’elles sont concernées par le duplicate content ou encore parce qu’elles manquent de contenus et qu’il leur faut éviter les sanctions des moteurs. La directive NoIndex a été créée pour que les webmasters puissent indiquer aux robots des moteurs de recherche de ne pas procéder à l’indexation pour certaines URLs.

Elle est à placer dans la partie <head> du code source et s’ajoute aux autres metadonnées. Elle prend la forme <meta name= »robots » content= »X,Y »> dans la balise meta robots de l’en-tête de la page, où X= »index » ou « noindex » et Y= »follow » ou « nofollow ». En effet, on dit en premier lieu au robot par le biais du noindex de ne pas indexer, mais il faudra lui préciser par la suite s’il faut suivre ou ne pas suivre les liens qui se trouvent dans la page en question dès lors qu’il y en a. L’attribut follow envoie les robots suivre les liens et l’attribut nofollow les arrête sur la page même.

Formation en SEO ?
Sylvain est là pour vous

16 ans d’expertise dans le marketing digital

Aussi utile contre le duplicate content !

Si la directive NoIndex a été créée, c’est parce que son utilisation sert non seulement à orienter les robots des moteurs, mais aussi à éviter les actions pénalisantes de ces derniers. Prenons l’exemple du duplicate content. Lorsqu’un moteur de recherche découvre dans son index des pages ou des parties de pages présentes sur différentes URLs, il passe à la pénalisation de certaines d’entre elles dans l’esprit de décourager le plagiat de contenus. Il y a pourtant des cas où la duplication de contenus est nécessaire, pour la publicité d’un produit sur plusieurs pages ou sur plusieurs sites par exemple.

Le moyen est alors donné au webmaster qui s’en occupe d’indiquer aux robots que telles et telles pages sont des duplicate contents donc à ne pas indexer et il peut aussi indiquer la page originale dont l’adresse est ce qu’on appelle URL canonique. NoIndex sert aussi à ne pas indexer les pages de résultats de recherche interne à un site web, les pages de pagination, les contenus protégés par les droits d’auteur et les pages en double catégorie. Il sert en outre à empêcher l’indexation pendant la phase où le webmaster met en ligne une page juste pour tester ses fonctionnalités. Il est important de faire la distinction entre NoIndex et Disallow. Le second est indiqué dans le fichier robots.txt et est une véritable instruction d’interdiction. Contrairement au NoIndex qui laisse les robots consulter le contenu de la page, le Disallow bloque totalement l’accès à la page. Il est essentiellement utilisé pour protéger des parties sensibles du site ou des contenus ne devant pas être consultés.

Vous souhaitez travailler avec notre agence ?