Guide pratique

Schema.org : le guide complet pour être compris par les IA

14 mars 2026 8 min de lecture

Votre site contient peut-être un contenu remarquable, mais si les moteurs de recherche et les IA ne comprennent pas sa structure, il reste invisible. Schema.org est le vocabulaire universel qui permet aux machines de lire vos pages comme un humain lirait une fiche d'identité : avec des champs clairs, des relations explicites et zéro ambiguïté.

Longtemps cantonné au SEO technique, Schema.org devient un levier central du GEO (Generative Engine Optimization). Les modèles de langage comme ChatGPT, Perplexity ou les AI Overviews de Google exploitent directement les données structurées pour formuler leurs réponses. Un site correctement balisé a significativement plus de chances d'être cité dans une réponse générée par l'IA.

Ce que Schema.org change concrètement

Schema.org est un standard ouvert, maintenu conjointement par Google, Microsoft, Yahoo et Yandex. Il définit des centaines de types d'entités (Organization, Person, Product, Event, Article, etc.) et leurs propriétés. Quand vous ajoutez ces balises à vos pages, vous ne changez pas ce que l'utilisateur voit. Vous changez ce que la machine comprend.

Pour les moteurs de recherche classiques, cela se traduit par des rich snippets : étoiles, prix, FAQ dépliables dans les résultats. Pour les IA génératives, l'impact est plus profond. Un LLM qui crawle votre page et trouve un bloc JSON-LD de type FAQPage avec des questions et réponses structurées va pouvoir extraire cette information avec une confiance bien supérieure à celle qu'il accorderait à un paragraphe de texte libre. La donnée structurée agit comme une source vérifiée, facile à parser et à citer.

JSON-LD : le format privilégié

Il existe trois syntaxes pour implémenter Schema.org : Microdata (attributs HTML inline), RDFa (attributs XML) et JSON-LD (bloc JavaScript dans le head). Google recommande explicitement JSON-LD, et c'est aussi le format le plus simple à maintenir.

Un bloc JSON-LD se place dans une balise script de type application/ld+json, généralement dans le head de la page. Il contient un objet avec un contexte (@context pointant vers schema.org), un type (@type définissant l'entité) et les propriétés associées. Par exemple, pour une organisation, vous déclarez le nom, l'URL, le logo, les coordonnées et les réseaux sociaux. Pour un article, vous précisez le titre, l'auteur, la date de publication et l'image.

L'avantage du JSON-LD est qu'il est complètement découplé du HTML visible. Vous pouvez le générer dynamiquement, le modifier sans toucher au template, et empiler plusieurs blocs sur une même page sans conflit.

Les 6 types essentiels pour la visibilité IA

Organization est la base. Il identifie votre entreprise avec son nom, son URL, son logo et ses profils sociaux. Sans ce type, les IA ne savent pas à quelle entité rattacher votre contenu. Déclarez-le sur votre page d'accueil au minimum.

FAQPage est probablement le type le plus puissant pour le GEO. Chaque paire question-réponse devient un bloc structuré que les IA peuvent extraire et reformuler directement. Les AI Overviews de Google puisent massivement dans les FAQPage pour construire leurs résumés.

LocalBusiness est indispensable pour les entreprises avec une présence physique. Adresse, horaires, téléphone, zone de service : ces informations structurées alimentent directement les réponses locales des IA.

Product et Service permettent de décrire vos offres avec prix, disponibilité, avis et caractéristiques. Un LLM qui compare des solutions pourra citer vos produits avec précision s'ils sont correctement balisés.

Person est crucial pour les indépendants, auteurs et experts. Il établit un lien d'autorité entre une personne et son contenu, ce que les IA utilisent pour évaluer la crédibilité d'une source (le fameux E-E-A-T de Google, appliqué au monde génératif).

Article structure vos contenus éditoriaux : titre, auteur, date, image. C'est le type utilisé par Google News, Discover et les AI Overviews pour identifier et classer les contenus informatifs.

Les erreurs qui neutralisent vos données structurées

La première erreur est de baliser sans cohérence. Si votre JSON-LD déclare un nom d'entreprise différent de celui affiché sur la page, Google et les IA détecteront l'incohérence et ignoreront le balisage. Les données structurées doivent refléter exactement le contenu visible.

La deuxième erreur fréquente est d'oublier les propriétés obligatoires. Chaque type Schema.org a des champs requis. Un Article sans datePublished, un Product sans name ou un LocalBusiness sans address seront rejetés par les validateurs et ignorés par les crawlers.

Troisième piège : ne baliser que la page d'accueil. Chaque page doit porter ses propres données structurées. Votre page de service a besoin d'un balisage Service. Votre FAQ doit contenir un FAQPage. Vos articles de blog nécessitent chacun un balisage Article. Les IA crawlent page par page, pas site par site.

Enfin, beaucoup de sites utilisent encore Microdata au lieu de JSON-LD, ce qui rend le balisage fragile : toute modification du HTML peut casser les données structurées sans que personne ne s'en aperçoive.

Schema.org et les IA génératives : le lien direct

Quand ChatGPT, Perplexity ou Gemini formulent une réponse, ils s'appuient sur des sources qu'ils jugent fiables et faciles à exploiter. Les données structurées cochent les deux cases. Un site avec un balisage Organization complet, des FAQPage sur ses pages de contenu et des Product sur ses pages commerciales envoie un signal clair : cette source est sérieuse, son information est vérifiable, et elle est facile à extraire.

Les AI Overviews de Google vont encore plus loin. Elles utilisent directement le Knowledge Graph, qui est alimenté en grande partie par les données Schema.org des sites web. Être présent dans le Knowledge Graph via un balisage correct, c'est multiplier ses chances d'apparaître dans les réponses générées en haut de la page de résultats.

Le Schema.org n'est plus un bonus technique pour obtenir de jolis résultats enrichis. C'est une infrastructure de visibilité, un langage que les IA parlent nativement. Les sites qui l'ignorent se privent d'un canal de découverte qui ne fera que croître dans les années à venir.


Vérifiez votre Schema.org

Analyse gratuite de vos données structurées, score GEO sur 100 en 60 secondes.

Analyser mon site gratuitement →