Étude data · échantillon mesuré

État de l'AEO en France 2026

Le marché SaaS marketing français est-il prêt pour l'ère des moteurs de réponse IA ? Nous avons mesuré 20 éditeurs français sur deux signaux techniques principaux — la politique des crawlers IA dans robots.txt et la maturité schema.org — auxquels nous ajoutons, à titre de signal communautaire, le fichier llms.txt (non adopté à ce jour par Google, OpenAI, Anthropic ou Perplexity). Voici les résultats bruts.

Publié le 24 mai 2026Par Hugo BertonBrandyze

llms.txt réel

1/20 sites · standard quasi inexistant

95%

Sans politique IA

19/20 ne nomment aucun crawler IA

21%

SoftwareApplication

4/19 balisent leur produit

68%

schema Organization

13/19 balisent l'entité marque

Méthodologie

Échantillon : 20 SaaS et outils marketing français (SEO, social listening, emailing, influence, marketing automation, outreach). Chaque domaine a été testé sur son hôte fonctionnel (apex ou www).

Date de mesure : 24 mai 2026. Les résultats reflètent l'état des sites à cette date et peuvent évoluer.

Méthode : requêtes HTTP GET en HTTPS (curl, user-agent desktop Chrome, timeout 20-30 s, redirections suivies), sans exécution JavaScript. Pour chaque site :

llms.txt — GET /llms.txt : on note le code HTTP, le content-type, et si le corps est un vrai fichier de directives, un placeholder vide, un fallback HTML, ou une 404.
Crawlers IA — GET /robots.txt : recherche explicite de GPTBot, ClaudeBot, PerplexityBot, Google-Extended, anthropic-ai, CCBot — nommés (autorisés / bloqués) ou totalement absents.
Schema.org— GET de la page d'accueil : extraction des blocs application/ld+json et de leurs @type (Organization, SoftwareApplication, FAQPage).

Limites assumées : la mesure est faite côté serveur sans rendu JavaScript. Un site injectant son JSON-LD au runtime apparaîtrait à tort « sans schema ». Les pages renvoyant un challenge anti-bot (Cloudflare) sont marquées « non mesuré » et exclues du calcul du pourcentage schema (échantillon schema ramené à 19). Les tests llms.txt et robots.txt ont abouti sur les 20 domaines (n = 20). L'échantillon est volontairement restreint et indicatif, pas statistiquement représentatif de l'ensemble du marché FR.

1. Adoption du `llms.txt` (signal communautaire)

⚠️ À lire avant les chiffres. llms.txt est une initiative communautaire (Jeremy Howard / Answer.AI) qui n'est pas adoptée par les acteurs majeurs: Google a confirmé fin 2025 ne pas l'utiliser (John Mueller, Gary Illyes), et OpenAI, Anthropic et Perplexity ne le documentent pas comme signal de crawl. Nous conservons la mesure pour la transparence et parce que certains acteurs spécialisés (Kagi, You.com…) l'observent, mais ce n'est pas le signal AEO le plus actionnable en 2026. Les deux qui comptent — robots.txt (sections 2) et schema.org (section 3) — sont en-dessous.

Le fichier llms.txt (servi en text/plainà la racine d'un domaine) est un standard proposépar la communauté pour déclarer aux modèles de langage les contenus de référence d'un site. Sur les 20 sites mesurés, un seul (kolsquare.com) en sert un réel et renseigné, soit 5%. Un autre (talkwalker.com) renvoie un fichier servi en 200 mais vide (« No llmsTxt content »), et un troisième (digimind.com) renvoie du HTML — ni l'un ni l'autre ne constituent un vrai llms.txt. Les 90% restants renvoient une 404. L'adoption réelle est marginale — ce qui, vu l'absence d'adoption côté Google/OpenAI/Anthropic/ Perplexity, est cohérent.

2. Politiques des crawlers IA

GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot et Google-Extended sont les principaux crawlers qui alimentent les réponses IA. Décider de les autoriser ou non est un choix stratégique. Pourtant 95% des sites (19 sur 20) ne les mentionnent jamaisdans leur robots.txt — ils sont donc tolérés par défaut, sans décision consciente. Un seul site (ranxplorer.com) les nomme, et c'est pour les bloquer. Zéro site ne les autorise explicitement. Le marché n'a pas encore arbitré la question de l'accès des IA à son contenu.

3. Maturité schema.org

Les données structurées schema.org rendent un contenu machine-lisible — un signal direct pour les moteurs de réponse. Sur 19 pages d'accueil mesurables, 79% ont au moins un bloc JSON-LD, mais seulement 21% déclarent un SoftwareApplication(le balisage attendu d'un éditeur logiciel), et 11% une FAQPage en home. 21% n'ont aucunedonnée structurée. La majorité balise l'entité marque (Organization : 68%) mais néglige la description machine-lisible du produit.

4. État des citations LLM

La conséquence logique des trois constats précédents : le marché est peu cité par les LLMs. En dogfooding, nous avons testé notre propre marque (Brandyze) sur un jeu de requêtes B2B en français représentant nos cas d'usage cible (suivi de citations, analyse de marque, audit AEO…). Résultat mesuré : zéro citation de Brandyze par Gemini sur ces requêtes ICP — cohérent avec une marque jeune et un marché à maturité AEO faible.

Précision honnête : ce dernier point est un constat sur notre propre marque (audit interne Brandyze), pas une mesure de part-of-voice sur les 20sites du panel — mesurer les citations LLM de tiers nécessite un protocole dédié, requête par requête, que nous n'avons pas mené ici. Nous le documentons en transparence et ne le généralisons pas au marché.

Données brutes — 20 sites mesurés

Une ligne par site, l'observé tel quel. Transparence totale, y compris les cas non mesurables.

Domaine	llms.txt	Crawlers IA	Organization	SoftwareApp	FAQPage	Schema détecté
semji.com	Absent	Non mentionnés	Non	Non	Non	WebSite, WebPage, BreadcrumbList, SearchAction
neocamino.com	Absent	Non mentionnés	Oui	Non	Non	Organization, WebSite, WebPage, ContactPoint, BreadcrumbList
merci-app.com	Absent	Non mentionnés	Oui	Non	Non	WebSite, Organization, ContactPoint
swello.com	Absent	Non mentionnés	Oui	Oui	Non	SoftwareApplication, Product, Offer, AggregateRating, Organization
mention.com	Absent	Non mentionnés	Oui	Non	Non	WebSite, WebPage, Organization, BreadcrumbList
agorapulse.com	Absent	Non mentionnés	Non	Non	Oui	FAQPage
plezi.co	Absent	Non mentionnés	n/a	n/a	n/a	Non mesuré (challenge anti-bot)
kolsquare.com	Réel	Non mentionnés	Oui	Non	Non	Organization
brevo.com	Absent	Non mentionnés	Oui	Oui	Non	SoftwareApplication, Offer, Organization, WebSite
iconosquare.com	Absent	Non mentionnés	Oui	Oui	Non	SoftwareApplication, Offer, AggregateRating, Review, Organization
digimind.com	Faux (HTML)	Non mentionnés	Oui	Non	Non	WebSite, WebPage, Organization, Person, Article
talkwalker.com	Vide / placeholder	Non mentionnés	Non	Non	Non	Aucun JSON-LD
haloscan.com	Absent	Non mentionnés	Oui	Non	Oui	FAQPage, Organization, ContactPoint
lemlist.com	Absent	Non mentionnés	Non	Non	Non	Aucun JSON-LD
waalaxy.com	Absent	Non mentionnés	Oui	Oui	Non	SoftwareApplication, Organization, Offer, WebSite
sarbacane.com	Absent	Non mentionnés	Non	Non	Non	Aucun JSON-LD
webmecanik.com	Absent	Non mentionnés	Oui	Non	Non	WebSite, WebPage, Organization, BreadcrumbList
ranxplorer.com	Absent	Bloqués	Oui	Non	Non	Product, Organization, AggregateRating, Review, BlogPosting, Brand
yooda.com	Absent	Non mentionnés	Oui	Non	Non	WebSite, WebPage, Organization, BreadcrumbList
visibrain.com	Absent	Non mentionnés	Non	Non	Non	Aucun JSON-LD

Survolez une cellule llms.txt ou Crawlers IA pour voir le détail brut observé. « n/a » = page d'accueil non mesurable (challenge anti-bot), exclue du calcul schema.

Recommandations

Quatre actions, classées du gain le plus immédiat au plus structurant, pour un éditeur SaaS FR qui veut prendre l'avance AEO.

Décider sa politique crawlers IA

Ne pas laisser le choix par défaut. Ajouter dans robots.txt des directives explicites pour GPTBot, ClaudeBot, PerplexityBot et Google-Extended — autoriser si l'on vise les citations LLM. 95% du marché ne l'a pas encore fait.

Baliser le produit en SoftwareApplication

Seuls 21% des éditeurs déclarent un schema SoftwareApplication. Ajouter Organization + SoftwareApplication + Offer + FAQPage en JSON-LD rend le produit machine-lisible — un avantage net sur les 21% sans aucun schema.

Publier un llms.txt (signal communautaire bonus)

5% seulement servent un vrai llms.txt. Google ne l'utilise pas et OpenAI/Anthropic/Perplexity ne l'ont pas adopté — mais le déposer reste un quick-win quasi gratuit, observé par certains acteurs spécialisés (Kagi, You.com…) et utile en signal éditorial. À ne pas considérer comme un signal Google/OpenAI prioritaire.

Mesurer ses citations LLM en continu

On ne pilote que ce qu'on mesure. Suivre, requête par requête, si sa marque est citée par ChatGPT, Claude, Perplexity et Gemini — et face à quels concurrents — est le seul moyen de transformer ces optimisations en part-of-voice.

Questions fréquentes

Combien de SaaS marketing français ont un fichier llms.txt en 2026 ?

Sur 20 SaaS et outils marketing français mesurés le 2026-05-24, un seul (kolsquare.com) sert un fichier llms.txt réel et renseigné, soit 5%. En comptant les fichiers servis en 200 text/plain mais vides ou placeholder, on monte à 10% (2 sur 20). Les 90% restants renvoient une 404 ou une page HTML. L'adoption du standard llms.txt est donc quasi nulle sur le marché SaaS marketing FR début 2026.

Les éditeurs SaaS français autorisent-ils les crawlers IA (GPTBot, ClaudeBot) ?

Dans notre panel de 20 sites, 95% (19 sur 20) ne mentionnent aucun crawler IA dans leur robots.txt — ni GPTBot, ni ClaudeBot, ni PerplexityBot, ni Google-Extended. Par défaut, via la directive "User-agent: *", ces crawlers sont donc tolérés. Un seul site (ranxplorer.com) nomme explicitement les crawlers IA, et c'est pour les bloquer. Aucun site ne les autorise nommément. Conclusion : le marché n'a pas encore pris de décision consciente sur l'accès des IA à son contenu.

Quel pourcentage de SaaS marketing FR balisent leur page d'accueil avec SoftwareApplication ?

Sur 19 pages d'accueil réellement mesurables (1 site exclu pour cause de challenge anti-bot), 21% (4 sur 19) déclarent un schema.org SoftwareApplication — le balisage attendu pour un produit logiciel. 68% (13 sur 19) ont au moins un schema Organization, et 21% (4 sur 19) n'ont aucune donnée structurée du tout. La maturité schema est moyenne : la majorité balise l'entité marque, mais peu décrivent le produit de façon machine-lisible.

Qu'est-ce que l'AEO et pourquoi est-ce un enjeu en 2026 ?

L'AEO (Answer Engine Optimization) consiste à optimiser un contenu pour être cité comme source par les moteurs de réponse et les assistants IA (ChatGPT, Claude, Perplexity, Gemini, Google AI Overview), plutôt que pour ranker dans les 10 liens bleus classiques. En 2026, une part croissante des recherches B2B commence par un LLM qui ne renvoie pas de clic : être absent des réponses générées = perdre en notoriété. L'AEO repose sur deux piliers techniques principaux mesurables : l'accessibilité aux crawlers IA (robots.txt) et la machine-lisibilité (schema.org), auxquels s'ajoute le signal communautaire llms.txt — standard non adopté à ce jour par Google (confirmé par John Mueller et Gary Illyes fin 2025), ni par OpenAI, Anthropic ou Perplexity.

Cette étude est-elle reproductible ?

Oui. Chaque chiffre provient d'une requête HTTP réelle (curl GET HTTPS, user-agent desktop, timeout 20-30 s) réalisée le 2026-05-24 sur l'hôte fonctionnel de chaque domaine. Le tableau de données brut ci-dessous liste, ligne par ligne, l'observé pour les 20 sites : statut llms.txt, politique crawlers IA, types schema.org détectés. La mesure est faite côté serveur sans exécution JavaScript — c'est la limite assumée : un site injectant son JSON-LD au runtime apparaîtrait à tort « sans schema ». Vous pouvez reproduire chaque ligne en quelques minutes.

Mesurez où vous en êtes

Suivez vos propres citations LLM sur ChatGPT, Claude, Perplexity et Gemini — ou explorez notre hub veille & e-réputation.

Suivre mes citations LLM Hub veille & e-réputation

Continuez votre exploration

Brandyze publie de la data sur les marques, créateurs et outils du marché FR. Tout est gratuit et data-driven.

État de l'AEO en France 2026

Méthodologie

1. Adoption du `llms.txt` (signal communautaire)

2. Politiques des crawlers IA

3. Maturité schema.org

4. État des citations LLM

Données brutes — 20 sites mesurés

Recommandations

Décider sa politique crawlers IA

Baliser le produit en SoftwareApplication

Publier un llms.txt (signal communautaire bonus)

Mesurer ses citations LLM en continu

Questions fréquentes

Mesurez où vous en êtes

Continuez votre exploration

Analyses de marques

Créateurs FR

Alternatives SaaS

Outils gratuits

Guides & blog

Méthodologie

1. Adoption du llms.txt (signal communautaire)

2. Politiques des crawlers IA

3. Maturité schema.org

4. État des citations LLM

Données brutes — 20 sites mesurés

Recommandations

Décider sa politique crawlers IA

Baliser le produit en SoftwareApplication

Publier un llms.txt (signal communautaire bonus)

Mesurer ses citations LLM en continu

Questions fréquentes

Mesurez où vous en êtes

Continuez votre exploration

Analyses de marques

Créateurs FR

Alternatives SaaS

Outils gratuits

Guides & blog

1. Adoption du `llms.txt` (signal communautaire)