Le référencement des documents en PDF est souvent négligé. Pourtant, ceux-ci à l’origine d’un trafic ciblé et non négligeable, dès lors que vos fichiers respectent un certain nombre de critères. En effet, durant le second semestre 2018, Google a fait connaître son intention d’optimiser l’indexation des documents de type PDF en les convertissant en HTML.
L’objectif pour le leader du Search est de permettre à de tels fichiers d’être plus visibles dans les résultats dès lors que ceux-ci sont pertinents par rapport à la requête de l’internaute. Cela implique donc une construction soignée de chacun des fichiers PDF incluant :
- un contenu qui ne soit pas uniquement sous la forme d’images comme c’est trop souvent le cas. Le contenu de chaque PDF doit ainsi être composé d’illustrations et de contenu éditorial ;
- les textes composants votre support doivent être de qualité et unique. Pour éviter le duplicate content, il faut donc proscrire tout copier-coller de contenus éditoriaux déjà présents sur le web ou sur l’une de vos propres pages ;
- l’optimisation des images employées dans le document. Comme pour une page web, chaque image doit disposer d’un nom explicite, d’un texte alternatif (balise ALT) et, si c’est possible, d’une légende ;
- une structure Hn pour baliser le contenu, autant pour faciliter la lecture pour l’internaute que pour faciliter la compréhension par les moteurs de recherche.