Technique

Comment ChatGPT choisit ses sources, et comment en faire partie

14 février 2026 8 min de lecture

La question que tout responsable marketing devrait se poser en 2026 n'est plus « suis-je en première page Google ? » mais « suis-je cité quand on pose une question sur mon secteur à une IA ? ».

Les 4 critères de sélection des LLMs

1. Accessibilité technique : Le crawler doit pouvoir lire votre site. Un robots.txt qui bloque GPTBot, ClaudeBot ou MistralBot exclut votre site de l'index de ces modèles. C'est la base : si les robots IA ne peuvent pas crawler votre contenu, vous n'existez pas pour eux.

2. Structure de l'information : Les IA préfèrent les contenus qui répondent directement à une question. Un paragraphe factuel sera toujours préféré à un paragraphe commercial. Les titres H2 et H3 formulés comme des questions, les listes à puces, les réponses directes et concises : tout cela augmente significativement vos chances d'être cité.

3. Données structurées : Le JSON-LD Schema.org est le langage que les IA lisent avant votre contenu. Organization, FAQPage, Service, Person : ces balises transmettent aux modèles exactement ce que vous faites, qui vous êtes et pourquoi vous êtes une source fiable.

4. Autorité et cohérence : Un site dont le contenu est cohérent, non contradictoire, et régulièrement mis à jour inspire davantage confiance aux modèles. La fraîcheur et la cohérence du contenu sont des signaux positifs pour tous les LLMs.

Le rôle clé du fichier llms.txt

Standard émergent apparu en 2024, le fichier llms.txt contient un résumé Markdown structuré de votre activité. C'est votre lettre d'introduction aux LLMs. Placé à la racine de votre domaine (ex: https://votre-site.fr/llms.txt), il résume qui vous êtes, ce que vous faites, et comment vous contacter.

20 minutes de travail pour une visibilité potentielle auprès de centaines de millions d'utilisateurs de ChatGPT, Claude, Perplexity et Mistral Le Chat. Les modèles qui intègrent ce standard privilégient les sites qui le respectent, notamment Perplexity, qui l'a adopté très tôt.

Ce que vous pouvez faire maintenant

Commencez par un audit de l'état actuel de votre site : votre robots.txt autorise-t-il les crawlers IA ? Avez-vous un llms.txt ? Votre Schema.org est-il complet et à jour ? Ces trois questions résument l'essentiel.

Une fois cet état des lieux établi, les corrections sont rapides à implémenter, et leur impact sur votre visibilité dans les IA peut être mesurable en quelques semaines.


Découvrez votre score GEO en 60 secondes

Analyse gratuite : robots.txt, llms.txt, Schema.org, contenu IA-ready. Score sur 100 avec recommandations.

Analyser mon site gratuitement →