3 marques fictives pour tester les signaux qui influencent les LLM

Pas le temps ? Obtenez un résumé de l'article :

Résumé et points clés de l’article

Une étude exploratoire a été menée pour analyser comment les modèles d'IA interprètent des marques fictives à partir de signaux divers. Les résultats montrent une reconnaissance inégale des marques par les LLM et soulèvent des inquiétudes sur la fiabilité des informations et la perception des sources par les IA.

Analyse de trois marques fictives créées pour l'étude.
Variabilité dans la reconnaissance des marques par différents LLM.
Risques d’hallucinations et d’informations erronées cohérentes dans les IA.
Importance d'une approche expérimentale plutôt que théorique.

Cet article reprend les éléments de ma conférence au SEO&GEO Summit 2026.

L’objectif n’était pas de livrer une énième prise de parole théorique sur le GEO ou la visibilité dans les IA. Nous voulions faire l’inverse : partir du terrain, monter un test simple, concret, observable, et regarder ce qui se passe réellement quand on injecte différents signaux autour d’une marque.

Nous avons donc créé trois marques fictives, publié plusieurs types de contenus, puis interrogé différents LLM pour mesurer ce qu’ils comprenaient, ce qu’ils retenaient, ce qu’ils citaient… et ce qu’ils déformaient. Ce que cette étude exploratoire montre, ce n’est pas seulement que l’on peut orienter les IA conversationnelles c’est surtout que leur rapport à la vérité, à la confiance et aux sources est beaucoup plus instable qu’on aimerait parfois le croire.

Note : les questions posées dans cette première partie du test ne concernent que des prompts de marque.

Pourquoi mener cette étude ?

Nous voyons passer beaucoup d’analyses sur la visibilité des marques dans les LLM. Certaines sont intéressantes, d’autres beaucoup plus spéculatives. Mais il y a souvent le même problème : on parle beaucoup de principes, pas assez d’expérimentations contrôlées.

C’est précisément ce qui nous a poussé à lancer cette étude. Nous voulions sortir du commentaire pour entrer dans l’observation. Non pas prouver à l’avance une théorie, mais construire un cadre assez propre pour voir ce que les modèles font réellement lorsqu’ils doivent répondre à des questions sur des marques récentes, peu connues, et entourées de signaux que l’on maîtrise.

J’insiste sur ce point, parce qu’il est important : il s’agit d’une étude exploratoire. Nous ne sommes pas partis avec l’idée de démontrer une vérité absolue. Nous voulions monitorer, comparer, observer, puis tirer des enseignements à partir de ce que les modèles ont effectivement produit. C’est aussi ce qui rend le test utile : il ne cherche pas à forcer une conclusion, il cherche à documenter un comportement. Le point de départ était d’ailleurs limpide : comprendre ce que trois marques fictives et quelques signaux glissés sur le web peuvent nous apprendre sur la véracité des réponses et sur la confiance que l’on peut, ou non, accorder aux IA.

Une étude française, sur des requêtes françaises, dans un contexte français

Cet aspect-là me paraît essentiel. Il existe déjà quelques études voisines, mais beaucoup ont été menées dans des contextes anglophones. Or, dès qu’on travaille sur des modèles, des sources et des corpus majoritairement francophones, les comportements changent.

Nous tenions donc à produire une étude ancrée dans notre réalité : des noms de domaine propres, des contenus en français, des requêtes de marque en français, des SERP françaises, des sources françaises, et des modèles interrogés dans ce contexte précis.

Autrement dit, on ne cherchait pas à savoir comment un LLM se comporte dans l’absolu. On voulait savoir comment il se comporte dans notre environnement réel, celui des marques françaises qui veulent exister dans les réponses générées.

La méthodologie

L’étude s’est déroulée du 23 janvier au 19 mars 2026. Après avoir choisi les marques, les sites à créer, les noms de domaine, les questions à monitorer, et enfin la mise en ligne des trois sites, l’étude a été découpée en plusieurs phases.

Important pour la suite de la lecture

Les sites créés sont appelés : les sites marques
À partir de la phase 2 : ce sont toujours les mêmes questions qui seront posées aux LLM jusqu’à la fin (environ 20 à 25 questions par sites marques) elles sont appelées : questions monitoring
Les articles publiés sur les sites externes de notre catalogue sont appelés : sites d’ensemencements

Phase 1 · Baseline

Question sur la connaissance de nos 3 sites marques › Enregistrement des réponses.

Phase 2 · Baseline monitoring