ChatGPT ne cite que 15 % des pages qu'il récupère dans ses réponses finales. Ce chiffre, documenté par plusieurs analyses récentes, pose une question brutale : qu'est-ce qui détermine si votre marque fait partie de ces 15 % ? La réponse n'est ni le PageRank, ni la densité de mots-clés. C'est la capacité des systèmes d'IA à identifier votre marque comme une entité fiable, connectée à un réseau de relations sémantiques vérifiables.
Du keyword matching au entity understanding : ce qui a changé
Les moteurs de recherche classiques fonctionnent sur un modèle d'information retrieval : requête → index inversé → scoring de pertinence. Les LLM fonctionnent différemment. Ils construisent des représentations internes d'entités (marques, personnes, concepts, produits) à partir de leur corpus d'entraînement et des données qu'ils récupèrent en temps réel.
Quand un utilisateur demande à ChatGPT « quel outil de monitoring SEO détecte les régressions de meta tags ? », le modèle ne cherche pas une page contenant ces mots-clés. Il interroge sa représentation interne des entités liées aux concepts "monitoring SEO", "régression", "meta tags" et tente de résoudre une réponse à partir des relations qu'il connaît entre ces entités.
Le Knowledge Graph comme socle
Google a formalisé cette approche dès 2012 avec le Knowledge Graph. Mais ce qui était un enrichissement des SERP est devenu le fondement de l'AI search. Les AI Overviews de Google, les réponses de Perplexity, les citations de ChatGPT Search — tous s'appuient sur des graphes d'entités pour décider quelles sources citer.
Une entité, au sens technique, c'est un nœud dans un graphe avec :
- Un identifiant unique (Wikidata QID, Google Knowledge Graph ID, URI schema.org)
- Des propriétés typées (nom, description, catégorie, date de création)
- Des relations vers d'autres entités (fondateur → personne, secteur → domaine, concurrent → autre entité)
Si votre marque n'existe pas comme entité dans ces graphes — ou si elle existe mais avec des propriétés incomplètes, incohérentes ou déconnectées — les LLM ne peuvent pas la résoudre comme réponse fiable. C'est aussi simple que ça.
Pourquoi les tactiques SEO superficielles ne suffisent plus
L'article de Search Engine Land sur l'entity authority souligne un point que nous avons déjà abordé : optimiser des title tags et des meta descriptions reste nécessaire pour le SEO classique, mais ces signaux sont largement ignorés par les LLM lors de la génération de réponses. Les modèles ne parsent pas vos balises HTML pour décider de vous citer. Ils s'appuient sur la cohérence et la densité du réseau d'informations structurées autour de votre entité.
Construire une entité machine-readable : le schema markup comme déclaration d'identité
Le premier levier technique concret, c'est le balisage Organization en JSON-LD. Pas le snippet minimal que la plupart des sites implémentent — une déclaration complète qui connecte votre entité à des identifiants externes vérifiables.
Le balisage Organization complet
Voici ce que devrait contenir le JSON-LD de la page d'accueil d'un SaaS B2B de 2 000 pages :
{
"@context": "https://schema.org",
"@type": "SoftwareApplication",
"@id": "https://seogard.io/#software",
"name": "Seogard",
"applicationCategory": "SEO Monitoring Tool",
"operatingSystem": "Web",
"offers": {
"@type": "Offer",
"price": "49",
"priceCurrency": "EUR"
},
"publisher": {
"@type": "Organization",
"@id": "https://seogard.io/#organization",
"name": "Seogard",
"url": "https://seogard.io",
"logo": {
"@type": "ImageObject",
"url": "https://seogard.io/images/logo.png",
"width": 300,
"height": 60
},
"sameAs": [
"https://www.linkedin.com/company/seogard",
"https://twitter.com/seogard_io",
"https://www.crunchbase.com/organization/seogard",
"https://www.wikidata.org/wiki/Q123456789"
],
"foundingDate": "2023",
"founder": {
"@type": "Person",
"name": "Nom du fondateur",
"sameAs": "https://www.linkedin.com/in/fondateur"
},
"knowsAbout": [
"Technical SEO",
"SEO Monitoring",
"Server-Side Rendering",
"Structured Data",
"Web Performance"
],
"areaServed": {
"@type": "GeoShape",
"addressCountry": ["FR", "BE", "CH", "CA"]
}
}
}
Trois éléments critiques dans ce balisage que la plupart des implémentations ignorent :
1. Le @id comme URI canonique de l'entité. C'est le pivot. Chaque fois que vous référencez votre organisation dans un autre bloc JSON-LD (article de blog, page produit, FAQ), vous devez pointer vers ce même @id. Cela crée un graphe interne cohérent que les crawlers sémantiques peuvent résoudre.
2. Les sameAs vers des identifiants tiers. Wikidata, Crunchbase, LinkedIn Company — ces liens ne sont pas décoratifs. Ils permettent aux systèmes d'IA de corroborer l'existence de votre entité à travers plusieurs sources. Un LLM qui trouve la même entité décrite de façon cohérente dans 5 sources différentes lui accorde une confiance supérieure à une entité mentionnée sur un seul domaine.
3. Le knowsAbout. Cette propriété, souvent négligée, déclare explicitement les domaines d'expertise de votre entité. Pour un LLM qui doit décider si votre marque est une source crédible sur le sujet "monitoring SEO technique", cette déclaration — si elle est corroborée par votre contenu réel — pèse dans la balance.
Propager l'entité sur chaque page
Le balisage Organization sur la homepage ne suffit pas. Chaque article de blog doit référencer l'entité publisher. Voici le pattern pour un article de blog avec référence croisée :
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Entity authority : fondation de la visibilité en AI search",
"datePublished": "2026-03-16",
"dateModified": "2026-03-16",
"author": {
"@type": "Organization",
"@id": "https://seogard.io/#organization"
},
"publisher": {
"@type": "Organization",
"@id": "https://seogard.io/#organization"
},
"mainEntityOfPage": {
"@type": "WebPage",
"@id": "https://seogard.io/blog/why-entity-authority-is-the-foundation-of-ai-search-visibility"
},
"about": [
{
"@type": "Thing",
"name": "Entity SEO",
"sameAs": "https://www.wikidata.org/wiki/Q116834435"
},
{
"@type": "Thing",
"name": "Structured Data",
"sameAs": "https://www.wikidata.org/wiki/Q26813700"
}
]
}
Le point clé ici est le champ about avec des références Wikidata. Vous ne décrivez pas seulement le sujet de votre article en texte libre — vous le connectez à des entités du graphe de connaissances global. C'est exactement le type de signal que les systèmes comme Google SGE et Perplexity utilisent pour associer votre contenu à un cluster thématique.
Pour un guide approfondi sur l'implémentation du balisage Article, consultez notre guide dédié au schema Article pour les blogs. Et si vous gérez un e-commerce, le schema Product suit exactement la même logique de rattachement à l'entité Organization.
La gouvernance d'entités : le vrai défi à l'échelle
Implémenter du JSON-LD sur 5 pages, n'importe quel développeur peut le faire en une après-midi. Maintenir la cohérence sémantique d'une entité à travers 15 000 pages, 3 sous-domaines, 4 langues et 12 développeurs qui déploient en continu — c'est un problème d'ingénierie.
Scénario concret : la migration d'un e-commerce fashion
Prenons Modalia (nom fictif), un e-commerce de mode avec 18 000 pages produit, 1 200 pages catégorie, et un blog de 400 articles. L'équipe décide de migrer de Magento 2 vers une stack headless (Next.js + API Commerce).
Pendant la migration :
- Le template JSON-LD des pages produit est réécrit. Le
@idde l'Organization change dehttps://modalia.fr/#orgàhttps://www.modalia.fr/#organization— une incohérence subtile qui casse toutes les références croisées. - Les pages catégorie perdent leur balisage
BreadcrumbListcar le composant React qui le générait n'a pas été porté. - Le blog, hébergé sur un sous-domaine
blog.modalia.fr, conserve l'ancien balisage qui pointe vers l'ancienne URL d'entité.
Résultat après 6 semaines : le Knowledge Panel de Modalia disparaît de Google. Les AI Overviews qui citaient la marque sur des requêtes comme "robe cocktail grande taille avis" cessent de la mentionner. Le trafic organique chute de 23 %, mais le trafic provenant des réponses AI (mesuré via les referrers chat.openai.com et perplexity.ai) chute de 61 %.
Le problème n'est pas un problème de contenu. C'est un problème de fragmentation d'entité. Le graphe de connaissances ne peut plus résoudre "Modalia" comme une entité unique et cohérente.
Automatiser la détection de fragmentation
Le premier réflexe est d'auditer manuellement avec Screaming Frog. Configuration pour extraire les @id de tous les blocs JSON-LD :
Dans Screaming Frog > Configuration > Custom > Extraction :
Regex: "@id"\s*:\s*"([^"]+)"
Lancez un crawl complet. Exportez les résultats. Vous obtenez la liste de tous les @id déclarés sur le site. Si vous trouvez plus d'une variante pour votre Organization (avec/sans www, avec/sans trailing slash, avec un fragment différent), vous avez un problème de gouvernance d'entité.
Mais l'audit ponctuel ne suffit pas. Un déploiement un vendredi soir peut casser votre balisage le samedi matin. C'est exactement le type de régression qu'un outil de monitoring comme Seogard détecte en continu — une disparition de JSON-LD ou un changement de @id déclenche une alerte avant que le crawler de Google ne passe.
Pour valider côté Google, utilisez l'API URL Inspection pour vérifier que le rich result est bien interprété après chaque déploiement.
Les signaux d'autorité d'entité que les LLM utilisent réellement
Le schema markup est la déclaration. Mais l'autorité d'entité se construit sur la corroboration. Un LLM ne fait pas confiance à ce que vous dites de vous-même — il fait confiance à ce que plusieurs sources indépendantes disent de vous.
Le triptyque de la corroboration
Sources primaires (votre site) : JSON-LD, contenu éditorial, documentation technique. Vous contrôlez entièrement ces signaux. Ils définissent les propriétés et relations que vous revendiquez.
Sources secondaires (tiers de confiance) : Wikidata, Wikipedia, Crunchbase, LinkedIn, PitchBook, annuaires professionnels. Ces sources valident l'existence de votre entité et certaines de ses propriétés (date de création, fondateur, secteur). Un LLM qui trouve votre marque sur Wikidata avec des propriétés cohérentes avec votre JSON-LD accorde un poids significativement supérieur à votre entité.
Sources contextuelles (mentions éditoriales) : articles de presse, études de cas, comparatifs, forums techniques. Ces mentions ne sont pas structurées, mais les LLM les utilisent pour évaluer la "notoriété" de votre entité dans un domaine spécifique.
Créer et maintenir votre fiche Wikidata
Si votre marque n'a pas encore de fiche Wikidata, c'est la première action à entreprendre. Voici les propriétés minimum à renseigner pour une entreprise SaaS :
| Propriété Wikidata | Code | Exemple |
|---|---|---|
| Instance of | P31 | Q4830453 (business enterprise) |
| Official website | P856 | https://modalia.fr |
| Founded | P571 | 2019 |
| Country | P17 | Q142 (France) |
| Industry | P452 | Q131524 (e-commerce) |
| CEO / Founder | P169 | Qxxx (lien vers la personne) |
Attention : Wikidata a des critères d'admissibilité. Votre entreprise doit avoir des sources secondaires fiables (articles de presse, couverture dans des médias notables). Si vous ne remplissez pas ces critères, la fiche sera supprimée. Concentrez-vous d'abord sur Crunchbase et LinkedIn Company, qui n'ont pas ces restrictions.
Le rôle sous-estimé du SSR pour les crawlers IA
Les crawlers des LLM (GPTBot, PerplexityBot, ClaudeBot) ont des capacités de rendu JavaScript limitées comparées à Googlebot. Si votre JSON-LD est injecté côté client via un framework JavaScript, il y a un risque réel que ces crawlers ne le voient pas.
C'est un argument supplémentaire en faveur du SSR plutôt que du CSR. Le JSON-LD doit être présent dans le HTML initial servi par le serveur, pas injecté après hydration React.
Pour vérifier ce que GPTBot voit réellement de votre page :
curl -A "Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.2; +https://openai.com/gptbot)" \
-s https://modalia.fr/robes/cocktail \
| grep -o '<script type="application/ld+json">.*</script>' \
| python3 -m json.tool
Si cette commande retourne un JSON vide ou mal formé, vos données structurées ne sont pas accessibles aux crawlers IA. Le problème est fréquent avec les sites en React SPA ou Vue.js sans Nuxt.
Mesurer l'entity authority : métriques et outils
L'entity authority n'est pas un score qu'une API vous renvoie. C'est un concept composite que vous devez évaluer à travers plusieurs signaux.
Vérifier votre présence dans le Knowledge Graph
L'API Google Knowledge Graph Search est publique et gratuite. Elle vous dit si Google reconnaît votre marque comme entité :
curl "https://kgsearch.googleapis.com/v1/entities:search?query=Modalia+fashion&key=VOTRE_CLE_API&limit=5&indent=True"
Si votre marque apparaît dans les résultats avec un @id de type kg:/m/xxxxx, vous existez dans le Knowledge Graph. Si elle n'apparaît pas, le travail de construction d'entité n'a pas encore porté ses fruits.
Analysez aussi le champ resultScore — c'est un proxy de la confiance que Google accorde à cette entité. Un score inférieur à 100 indique une entité faiblement établie. Les marques bien établies dans leur domaine obtiennent des scores entre 500 et 5000.
Auditer les citations IA
Pour mesurer votre visibilité dans les réponses AI, il n'existe pas encore d'outil standardisé. Mais vous pouvez mettre en place un monitoring basique :
- Identifiez vos 50 requêtes cibles — celles pour lesquelles vous voulez être cité dans les réponses AI.
- Interrogez périodiquement les APIs de ChatGPT, Perplexity et Google AI Overviews pour ces requêtes.
- Tracez si votre domaine apparaît dans les sources citées.
Les divergences entre citations AIO et rankings classiques sont désormais documentées : ranker en position 3 ne garantit pas d'être cité dans l'AI Overview. L'entity authority explique une partie significative de cet écart.
Le graphe interne : structurer les relations entre vos propres pages
L'entity authority ne concerne pas uniquement votre entité Organisation. Chaque page de votre site devrait être elle-même une entité avec des relations explicites vers d'autres entités de votre graphe interne.
Le maillage sémantique via @id et mentions
Sur un blog technique avec 400 articles, chaque article devrait déclarer les entités qu'il mentionne :
{
"@context": "https://schema.org",
"@type": "Article",
"@id": "https://modalia.fr/blog/guide-tailles-robes/#article",
"headline": "Guide des tailles robes : tableau complet 2026",
"mentions": [
{
"@type": "Product",
"@id": "https://modalia.fr/robes/cocktail-noire/#product"
},
{
"@type": "Brand",
"@id": "https://modalia.fr/#organization"
}
],
"isPartOf": {
"@type": "Blog",
"@id": "https://modalia.fr/blog/#blog"
}
}
Ce pattern crée un graphe de connaissances interne à votre site. Quand un crawler sémantique explore vos pages, il ne voit pas juste des pages liées par des <a href> — il voit des entités connectées par des relations typées. C'est cette couche de sens qui différencie un site "riche en contenu" d'un site "riche en entités".
Pour les breadcrumbs, la logique est identique : le balisage BreadcrumbList n'est pas qu'un enrichissement SERP, c'est une déclaration hiérarchique de vos entités.
Cohérence avec le sitemap
Votre sitemap XML devrait refléter la structure de votre graphe d'entités. Si vous déclarez 18 000 entités Product dans vos JSON-LD, ces 18 000 URLs doivent être dans le sitemap. Une entité déclarée mais non indexable est un signal de bruit qui dégrade la confiance globale.
Les edge cases et les pièges
Le piège du sur-balisage
Déclarer des propriétés schema.org que vous ne pouvez pas corroborer est contre-productif. Si votre JSON-LD indique "knowsAbout": "Machine Learning" mais que vous n'avez aucun contenu sur le sujet, vous créez une incohérence que les systèmes de vérification automatique détectent.
Google a documenté explicitement que le balisage doit refléter le contenu visible de la page. Les LLM appliquent la même logique, en comparant les déclarations structurées au contenu textuel qu'ils extraient.
Multi-domaines et filiales
Pour les groupes avec plusieurs marques, chaque marque doit avoir son propre @id d'entité, avec des relations explicites (parentOrganization, subOrganization) vers l'entité mère. Ne jamais utiliser le même @id pour deux marques distinctes, même si elles partagent un domaine parent.
Les redirections comme destructeurs d'identité
Une chaîne de redirections sur l'URL contenant votre balisage Organization principal peut empêcher les crawlers de résoudre correctement votre entité. Si https://modalia.fr redirige vers https://www.modalia.fr qui redirige vers https://www.modalia.fr/fr/, le crawler peut abandonner avant d'atteindre le JSON-LD. Assurez-vous que l'URL canonique de votre entité est accessible en une seule redirection maximum.
Prise en compte du rendu JavaScript
Googlebot exécute le JavaScript, mais avec un délai (la fameuse "deuxième vague d'indexation"). GPTBot et les autres crawlers IA ne l'exécutent généralement pas du tout. Tester avec curl comme montré plus haut est le minimum. Pour un audit plus complet, désactivez JavaScript dans Chrome DevTools (F12 > Settings > Debugger > Disable JavaScript) et vérifiez que votre JSON-LD est présent dans le DOM initial.
De la théorie à la pratique : checklist de gouvernance d'entité
Pour les équipes qui gèrent des sites de 500+ pages, la gouvernance d'entité n'est pas un projet one-shot. C'est un processus continu qui s'intègre dans le pipeline de déploiement.
Pré-déploiement : un test automatisé dans la CI/CD qui valide la présence et la cohérence des @id JSON-LD sur les templates critiques. Si le @id de l'Organization change, le build échoue.
Post-déploiement : un monitoring continu (Seogard le fait nativement) qui compare le JSON-LD avant/après chaque déploiement et alerte sur les disparitions ou modifications d'entités.
Trimestriel : audit complet via Screaming Frog avec extraction custom des @id, croisement avec le sitemap, vérification des sameAs (les URLs externes existent-elles encore ?), et test de l'API Knowledge Graph pour suivre l'évolution du resultScore.
L'entity authority n'est pas un hack ni une tendance passagère. C'est le modèle mental que les systèmes d'IA utilisent pour décider quelles marques méritent d'être citées. Les équipes qui industrialisent leur gouvernance d'entités aujourd'hui construisent un avantage compétitif structurel pour les 5 prochaines années de recherche AI — et un outil de monitoring capable de détecter la moindre régression de balisage est le filet de sécurité qui empêche cet avantage de se volatiliser au prochain déploiement.