WebMCP : pourquoi préparer votre site maintenant

Schema.org a mis 5 ans à devenir incontournable. Les rich snippets ont récompensé les early adopters pendant des années avant que la majorité ne s'y mette. WebMCP suit exactement la même trajectoire — sauf que cette fois, le délai sera compressé par la vitesse d'adoption des agents IA.

Ce qu'est WebMCP et pourquoi ce n'est pas "juste un autre standard"

MCP — Model Context Protocol — est un protocole ouvert initié par Anthropic fin 2024 pour standardiser la communication entre les LLM et les sources de données externes. WebMCP en est la déclinaison web : un mécanisme qui permet à un agent IA de découvrir, comprendre et exécuter les actions disponibles sur un site web, sans scraping ni reverse-engineering du DOM.

La différence fondamentale avec ce qui existe déjà (schema.org, OpenAPI, sitemaps) : WebMCP ne décrit pas des données statiques. Il expose des capacités. Un agent IA qui arrive sur un site e-commerce via WebMCP ne lit pas une fiche produit — il sait qu'il peut chercher un produit par catégorie, filtrer par prix, vérifier la disponibilité en stock, et ajouter au panier. Il comprend les actions possibles et leurs paramètres.

Pensez-y comme la différence entre un fichier sitemap.xml (voici mes pages) et un fichier webmcp.json (voici ce que vous pouvez faire sur mon site, et comment).

Le parallèle avec schema.org est instructif, mais incomplet

Schema.org décrit des entités. WebMCP décrit des interfaces d'interaction. Les deux sont complémentaires :

Schema.org dit : "Cette page contient un produit, prix 49€, en stock"
WebMCP dit : "Vous pouvez rechercher des produits (paramètres : query, category, price_range), consulter un produit (paramètre : product_id), et passer commande (paramètres : product_id, quantity, shipping_address)"

Le premier est une annotation passive. Le second est un contrat d'API lisible par une machine. C'est cette différence qui rend WebMCP critique pour l'ère des agents IA : ces agents ne se contentent pas de lire du contenu, ils agissent.

Pourquoi les agents IA ont besoin de ce standard

Aujourd'hui, un agent IA comme ceux construits sur GPT-4, Claude ou Gemini qui veut interagir avec un site a trois options :

Scraping du HTML — fragile, dépendant du DOM, casse à chaque redesign
API documentée — nécessite une intégration custom par site
Simulation de navigation — lent, coûteux en tokens, peu fiable

Aucune de ces options ne scale. WebMCP résout ce problème en fournissant un contrat standardisé que n'importe quel agent peut consommer sans intégration spécifique.

La spécification technique : anatomie d'un fichier WebMCP

À ce stade, le standard est encore en phase de draft, mais les éléments structurels sont suffisamment stables pour commencer à prototyper. Un fichier WebMCP se place à la racine du site (convention : /.well-known/webmcp.json) et décrit les "tools" — les capacités exposées par le site.

Voici un exemple concret pour un site e-commerce de mobilier avec 15 000 références :

{
  "schema_version": "0.1.0",
  "name": "MaisonDeco",
  "description": "Mobilier et décoration d'intérieur - 15 000 produits",
  "url": "https://www.maisondeco.fr",
  "authentication": {
    "type": "none",
    "note": "Les actions de consultation sont publiques. L'ajout au panier nécessite un session token."
  },
  "tools": [
    {
      "name": "search_products",
      "description": "Recherche de produits par mot-clé, catégorie, fourchette de prix et disponibilité",
      "parameters": {
        "type": "object",
        "properties": {
          "query": {
            "type": "string",
            "description": "Termes de recherche en langage naturel"
          },
          "category": {
            "type": "string",
            "enum": ["canape", "table", "chaise", "luminaire", "rangement", "decoration"],
            "description": "Catégorie principale du produit"
          },
          "price_min": {
            "type": "number",
            "description": "Prix minimum en euros"
          },
          "price_max": {
            "type": "number",
            "description": "Prix maximum en euros"
          },
          "in_stock_only": {
            "type": "boolean",
            "default": true,
            "description": "Filtrer uniquement les produits disponibles"
          }
        },
        "required": ["query"]
      },
      "endpoint": "/api/mcp/search",
      "method": "GET"
    },
    {
      "name": "get_product_details",
      "description": "Détails complets d'un produit : specs, avis, délai de livraison, produits similaires",
      "parameters": {
        "type": "object",
        "properties": {
          "product_id": {
            "type": "string",
            "description": "Identifiant unique du produit (format: MD-XXXXX)"
          }
        },
        "required": ["product_id"]
      },
      "endpoint": "/api/mcp/product/{product_id}",
      "method": "GET"
    },
    {
      "name": "check_delivery",
      "description": "Vérifie le délai et le coût de livraison pour un code postal donné",
      "parameters": {
        "type": "object",
        "properties": {
          "product_id": { "type": "string" },
          "postal_code": { "type": "string", "pattern": "^[0-9]{5}$" }
        },
        "required": ["product_id", "postal_code"]
      },
      "endpoint": "/api/mcp/delivery",
      "method": "GET"
    }
  ]
}

Plusieurs points méritent attention dans cette structure :

Les descriptions en langage naturel sont critiques. Un agent LLM choisit quel tool utiliser en se basant sur la sémantique des descriptions, pas sur les noms de champs. Une description vague comme "Cherche des trucs" vs. "Recherche de produits par mot-clé, catégorie, fourchette de prix et disponibilité" changera radicalement le taux de sélection correcte par l'agent.

Les enums guident l'agent. Sans le champ enum sur category, l'agent devrait deviner les catégories disponibles. Avec, il peut proposer des choix pertinents à l'utilisateur humain qu'il assiste.

L'authentification est explicite. L'agent sait immédiatement quelles actions sont accessibles sans friction et lesquelles nécessitent un contexte de session.

Scénario concret : MaisonDeco, 15 000 pages, migration vers WebMCP

Prenons un cas réaliste. MaisonDeco.fr est un e-commerce de mobilier :

15 000 pages produit, 200 pages catégorie, 50 pages guide d'achat
Stack : Next.js 14 avec SSR, API REST existante, données produit dans un PIM (Akeneo)
Trafic organique : 180 000 sessions/mois, dont ~12 000 déjà attribuées à des réponses IA (AI Overviews, Bing Chat)
Le site a déjà du schema.org Product sur toutes les fiches

Phase 1 : Audit de ce qui est déjà exposable

Avant d'écrire une ligne de code WebMCP, l'équipe inventorie les capacités existantes du site qui ont de la valeur pour un agent IA :

Recherche produit — le moteur de recherche interne existe déjà en API
Filtrage par catégorie/prix/marque — les facettes existent côté Elasticsearch
Vérification stock — endpoint API existant utilisé par le front
Calcul livraison — déjà exposé pour le checkout
Consultation avis clients — agrégés dans le PIM

L'audit révèle que 4 de ces 5 capacités ont déjà un endpoint API interne. Le travail n'est pas de recréer une API — c'est de créer une couche de description standardisée par-dessus l'existant, et éventuellement un proxy qui adapte les paramètres.

Phase 2 : Implémentation du endpoint MCP

L'équipe crée un middleware Next.js qui sert le fichier de déclaration et route les appels MCP vers les API internes :

// app/api/mcp/search/route.ts
import { NextRequest, NextResponse } from 'next/server';
import { searchProducts } from '@/lib/elasticsearch';
import { validateMCPRequest, rateLimitMCP } from '@/lib/mcp-middleware';

export async function GET(request: NextRequest) {
  // Rate limiting spécifique aux agents MCP
  const rateLimitResult = await rateLimitMCP(request, {
    windowMs: 60_000,
    maxRequests: 30, // 30 requêtes/min par agent
    keyExtractor: (req) => req.headers.get('x-mcp-agent-id') || req.ip || 'unknown'
  });

  if (!rateLimitResult.allowed) {
    return NextResponse.json(
      { error: 'Rate limit exceeded', retryAfter: rateLimitResult.retryAfter },
      { status: 429 }
    );
  }

  const { searchParams } = new URL(request.url);
  const query = searchParams.get('query');
  const category = searchParams.get('category');
  const priceMin = searchParams.get('price_min') ? Number(searchParams.get('price_min')) : undefined;
  const priceMax = searchParams.get('price_max') ? Number(searchParams.get('price_max')) : undefined;
  const inStockOnly = searchParams.get('in_stock_only') !== 'false';

  if (!query) {
    return NextResponse.json(
      { error: 'Parameter "query" is required' },
      { status: 400 }
    );
  }

  const results = await searchProducts({
    query,
    category,
    priceRange: priceMin || priceMax ? { min: priceMin, max: priceMax } : undefined,
    inStockOnly,
    limit: 10 // On limite la réponse pour contrôler le coût en tokens côté agent
  });

  // Format de réponse enrichi pour les agents
  return NextResponse.json({
    results: results.map(product => ({
      id: product.sku,
      name: product.title,
      price: product.price,
      currency: 'EUR',
      url: `https://www.maisondeco.fr/produit/${product.slug}`,
      image: product.mainImage,
      availability: product.inStock ? 'InStock' : 'OutOfStock',
      rating: product.averageRating,
      reviewCount: product.reviewCount,
      delivery_estimate: product.deliveryDays ? `${product.deliveryDays} jours ouvrés` : null
    })),
    total: results.totalCount,
    query_understood_as: query // Utile pour le debug et la transparence
  });
}

Notez les choix de design :

Rate limiting par agent : vous ne voulez pas qu'un agent mal configuré DDOS votre API produit. Le header x-mcp-agent-id permettra d'identifier et de bloquer les agents abusifs.
Limite de résultats : 10 résultats par requête. Un agent IA paie en tokens chaque donnée reçue. Envoyer 500 produits est un anti-pattern.
URL canonique dans chaque résultat : l'agent peut renvoyer l'utilisateur vers votre site. C'est le mécanisme d'attribution du trafic.

Phase 3 : Découvrabilité

Le fichier webmcp.json à /.well-known/ ne suffit pas. Il faut aussi signaler son existence dans le HTML, à la manière d'un lien rel="alternate" pour les flux RSS :

<!-- Dans le <head> de toutes les pages -->
<link rel="webmcp" href="/.well-known/webmcp.json" type="application/json" />

<!-- Optionnel mais recommandé : dans robots.txt -->
<!-- Ajout en fin de robots.txt -->

Et dans le robots.txt :

User-agent: *
Allow: /

# WebMCP discovery
WebMCP: https://www.maisondeco.fr/.well-known/webmcp.json

Cette double déclaration (HTML + robots.txt) maximise les chances de découverte, quel que soit le point d'entrée de l'agent.

Résultats projetés

L'équipe de MaisonDeco estime que si les agents IA de type assistant shopping (Google Shopping AI, ChatGPT plugins, Perplexity Shopping) adoptent WebMCP au S2 2026, le site pourrait capter entre 5 000 et 15 000 sessions mensuelles supplémentaires via ce canal — soit 3 à 8 % de trafic incrémental. L'hypothèse repose sur le fait que les agents préféreront les sites avec WebMCP (réponses structurées, fiables, rapides) aux sites qu'ils doivent scraper (lent, fragile, données partielles).

Ce que WebMCP change pour le SEO technique

Le crawl budget est complété par un "agent budget"

Googlebot crawle vos pages HTML. Un agent IA appelle vos tools MCP. Les deux consomment des ressources serveur, mais de manière radicalement différente.

Un crawl classique de 15 000 pages par Googlebot génère ~15 000 requêtes HTTP sur plusieurs jours. Un agent MCP qui répond à une requête utilisateur ("trouve-moi un canapé en velours vert à moins de 800€") génère 1 à 3 appels API ciblés. Le ratio signal/bruit est incomparable.

Mais cela crée une nouvelle surface à monitorer. Si votre endpoint /api/mcp/search renvoie une 500, aucun agent IA ne recommandera vos produits. C'est l'équivalent d'un site entier qui retourne des 500 à Googlebot — sauf que personne dans votre équipe ne surveille ces endpoints aujourd'hui.

C'est exactement le type de régression qu'un outil de monitoring comme Seogard peut détecter : un endpoint MCP qui passe de 200 à 500, un temps de réponse qui explose, un fichier webmcp.json qui disparaît après un déploiement.

Les meta descriptions deviennent les tool descriptions

En SEO classique, la meta description n'impacte pas le ranking mais influence le CTR dans les SERP. En WebMCP, la description de chaque tool est l'équivalent : elle n'affecte pas directement l'indexation, mais elle détermine si l'agent choisit votre tool plutôt que celui d'un concurrent.

La qualité rédactionnelle de ces descriptions devient un avantage compétitif direct. Comparez :

// Mauvais : vague, n'aide pas l'agent à décider
{
  "name": "search",
  "description": "Search for things on our website"
}

// Bon : précis, informatif, mentionne les capacités spécifiques
{
  "name": "search_furniture",
  "description": "Search 15,000+ furniture products by keyword, category (sofa, table, chair, lighting, storage, decor), price range (EUR), brand, material, and color. Returns availability, delivery estimates, and customer ratings."
}

L'agent LLM, face à 10 sources MCP possibles pour une requête "canapé velours vert", choisira celle dont la description indique clairement qu'on peut filtrer par matière et couleur.

Le lien entre schema.org existant et WebMCP

Si vous avez déjà du schema.org bien implémenté, vous avez un avantage : la structure de vos données est déjà formalisée. Vos types Product, Offer, AggregateRating mappent directement vers les champs de réponse de vos tools MCP.

Mais attention au piège : schema.org décrit ce qui est sur une page. WebMCP décrit ce qu'un agent peut faire. Avoir du schema.org impeccable ne vous dispense pas de WebMCP — cela accélère simplement son implémentation parce que le modèle de données existe déjà.

Les risques d'une implémentation précipitée

Exposer trop de surface d'attaque

Chaque tool WebMCP est un endpoint API accessible publiquement. Si vous exposez un tool create_order sans authentification robuste, vous ouvrez une surface d'attaque massive. Règle de base : ne commencez qu'avec des tools en lecture seule. Recherche, consultation, vérification de stock — rien qui modifie l'état de votre système.

Le coût serveur invisible

Un agent populaire comme ChatGPT, s'il intègre votre WebMCP, peut générer des milliers d'appels par heure. Contrairement au crawl de Googlebot (que vous pouvez throttler via Crawl-delay), les appels MCP d'agents multiples sont plus difficiles à prévoir.

La réponse technique : un rate limiting par agent-id, un cache agressif sur les réponses (les prix et stocks changent, mais pas à la seconde), et un monitoring des coûts d'infrastructure dédiés au trafic MCP.

# nginx rate limiting pour les endpoints MCP
limit_req_zone $http_x_mcp_agent_id zone=mcp_agents:10m rate=30r/m;

location /api/mcp/ {
    limit_req zone=mcp_agents burst=10 nodelay;
    limit_req_status 429;

    # Cache de 5 minutes pour les recherches produit
    proxy_cache mcp_cache;
    proxy_cache_valid 200 5m;
    proxy_cache_key "$request_uri|$args";

    # Headers de traçabilité
    add_header X-MCP-Cache-Status $upstream_cache_status;
    add_header X-MCP-Rate-Remaining $limit_req_status;

    proxy_pass http://nextjs_upstream;
}

Le standard n'est pas finalisé

C'est le trade-off majeur. WebMCP est encore un draft. La structure du fichier de déclaration, les conventions d'authentification, le mécanisme de découverte — tout peut encore évoluer. Implémenter aujourd'hui signifie accepter de potentiellement refactorer dans 6 mois.

C'est un risque calculé. Les early adopters de schema.org en 2011 ont aussi dû adapter leur markup à mesure que le vocabulaire évoluait. Ceux qui avaient déjà la discipline de structurer leurs données ont eu un avantage durable sur ceux qui ont attendu la version "stable".

Comment vous préparer sans sur-investir

La stratégie optimale n'est pas d'implémenter un WebMCP complet en production demain. C'est de préparer les fondations pour que l'implémentation soit triviale quand le standard se stabilisera.

Étape 1 : Inventorier vos capacités exposables

Listez toutes les actions qu'un utilisateur peut faire sur votre site. Pour chaque action, notez :

Les paramètres d'entrée
Le format de sortie
L'endpoint API existant (ou à créer)
Le niveau d'authentification requis

Si vous n'avez pas d'API interne pour votre recherche ou votre catalogue produit, c'est le moment de la construire — elle servira aussi pour votre front-end headless, vos applications mobiles, et vos intégrations partenaires.

Étape 2 : Structurer vos API existantes en mode "agent-friendly"

Un endpoint conçu pour un front-end React renvoie souvent trop de données (HTML partials, état du composant, données de layout). Un endpoint MCP doit renvoyer des données denses et structurées, sans bruit.

Créez un layer API dédié (/api/mcp/*) qui formate les réponses pour des consommateurs machines : JSON pur, champs explicitement nommés, URLs canoniques incluses dans chaque objet.

Étape 3 : Monitorer la découverte par les agents IA dès maintenant

Les agents IA commencent déjà à chercher des fichiers de type /.well-known/ et à parser les sitemaps de manière non conventionnelle. Surveillez vos logs serveur pour détecter les user-agents des bots IA — GPTBot, ClaudeBot, PerplexityBot — et ce qu'ils demandent.

Si vous voyez des requêtes vers /.well-known/mcp.json ou /.well-known/webmcp.json dans vos logs, c'est que les agents cherchent déjà. Ne pas répondre, c'est comme ne pas avoir de sitemap.xml en 2010.

Étape 4 : Aligner votre stack SEO existante

Votre schema.org, vos sitemaps, votre SSR — tout cela reste critique. Un agent IA qui ne trouve pas de WebMCP retombera sur le scraping HTML classique, et là, votre JavaScript rendering doit être impeccable.

WebMCP n'est pas un remplacement du SEO technique existant. C'est une couche additionnelle. Un site avec un SSR cassé, des canonical en bazar et pas de schema.org ne sera pas sauvé par un fichier WebMCP. À l'inverse, un site dont les fondations SEO sont solides n'a besoin que de cette couche supplémentaire pour être prêt pour l'ère des agents.

WebMCP dans l'écosystème plus large de l'AI discovery

WebMCP ne vit pas dans le vide. Il s'inscrit dans un mouvement plus large où chaque moteur de recherche et chaque fournisseur d'IA construit sa propre couche d'interaction avec les sites web.

Google teste de nouveaux standards d'autorisation pour les bots. Bing travaille sur des mécanismes de grounding qui diffèrent fondamentalement de l'indexation classique. Les AI Overviews de Google intègrent de plus en plus de liens, ce qui signifie que la visibilité dans les réponses IA se monétise déjà.

WebMCP pourrait devenir le standard qui unifie ces approches fragmentées. Plutôt que d'implémenter une intégration spécifique pour chaque agent IA, vous déclarez vos capacités une fois, et chaque agent les consomme selon le même protocole.

C'est exactement ce qu'a fait schema.org pour les moteurs de recherche traditionnels : un vocabulaire unique compris par Google, Bing, Yahoo et Yandex. La promesse de WebMCP est la même, mais pour les agents IA.

Le pipeline de visibilité IA ne se résume plus au contenu bien ranké dans les SERP classiques. Il inclut désormais la capacité à être sélectionné comme source par un agent IA, et WebMCP est le mécanisme qui rend cette sélection explicite plutôt qu'implicite.

Les signaux qui montrent que le momentum est réel

Trois indicateurs concrets suggèrent que WebMCP n'est pas un énième standard voué à l'oubli :

L'adoption côté tooling. Les SDK MCP d'Anthropic sont open source et activement maintenus. La documentation officielle est disponible sur modelcontextprotocol.io. OpenAI et Google ont exprimé leur intérêt pour des protocoles d'interaction standardisés — même s'ils n'ont pas encore officiellement adopté MCP, la pression du marché pousse vers la convergence.

L'usage en production. Des entreprises comme Replit, Notion, et Zapier ont déjà implémenté des serveurs MCP. Ce ne sont pas des proof-of-concepts — ce sont des intégrations en production utilisées par des millions d'utilisateurs.

Le comportement des bots dans les logs. Si vous analysez vos logs serveur sur les 3 derniers mois, vous constaterez probablement une augmentation des requêtes provenant d'agents IA. Ces agents testent déjà ce qu'ils peuvent faire sur vos sites. WebMCP formalise ce qu'ils font déjà de manière informelle.

Le SEO a toujours récompensé ceux qui structurent l'information avant que ce ne soit obligatoire. WebMCP est au croisement de cette discipline et de la nouvelle réalité des agents IA comme couche de découverte. Préparez vos API, inventoriez vos capacités, et mettez en place le monitoring qui détectera les régressions sur cette nouvelle surface — Seogard surveille déjà les signaux qui comptent pour cette transition.