Étude data · échantillon mesuré
État de l'AEO en France 2026
Le marché SaaS marketing français est-il prêt pour l'ère des moteurs de réponse IA ? Nous avons mesuré 20 éditeurs français sur deux signaux techniques principaux — la politique des crawlers IA dans robots.txt et la maturité schema.org — auxquels nous ajoutons, à titre de signal communautaire, le fichier llms.txt (non adopté à ce jour par Google, OpenAI, Anthropic ou Perplexity). Voici les résultats bruts.
Publié le 24 mai 2026Par Hugo BertonBrandyze
Méthodologie
Échantillon : 20 SaaS et outils marketing français (SEO, social listening, emailing, influence, marketing automation, outreach). Chaque domaine a été testé sur son hôte fonctionnel (apex ou www).
Date de mesure : 24 mai 2026. Les résultats reflètent l'état des sites à cette date et peuvent évoluer.
Méthode : requêtes HTTP GET en HTTPS (curl, user-agent desktop Chrome, timeout 20-30 s, redirections suivies), sans exécution JavaScript. Pour chaque site :
- llms.txt — GET
/llms.txt: on note le code HTTP, le content-type, et si le corps est un vrai fichier de directives, un placeholder vide, un fallback HTML, ou une 404. - Crawlers IA — GET
/robots.txt: recherche explicite de GPTBot, ClaudeBot, PerplexityBot, Google-Extended, anthropic-ai, CCBot — nommés (autorisés / bloqués) ou totalement absents. - Schema.org— GET de la page d'accueil : extraction des blocs
application/ld+jsonet de leurs@type(Organization, SoftwareApplication, FAQPage).
Limites assumées : la mesure est faite côté serveur sans rendu JavaScript. Un site injectant son JSON-LD au runtime apparaîtrait à tort « sans schema ». Les pages renvoyant un challenge anti-bot (Cloudflare) sont marquées « non mesuré » et exclues du calcul du pourcentage schema (échantillon schema ramené à 19). Les tests llms.txt et robots.txt ont abouti sur les 20 domaines (n = 20). L'échantillon est volontairement restreint et indicatif, pas statistiquement représentatif de l'ensemble du marché FR.
1. Adoption du llms.txt (signal communautaire)
Le fichier llms.txt (servi en text/plainà la racine d'un domaine) est un standard proposépar la communauté pour déclarer aux modèles de langage les contenus de référence d'un site. Sur les 20 sites mesurés, un seul (kolsquare.com) en sert un réel et renseigné, soit 5%. Un autre (talkwalker.com) renvoie un fichier servi en 200 mais vide (« No llmsTxt content »), et un troisième (digimind.com) renvoie du HTML — ni l'un ni l'autre ne constituent un vrai llms.txt. Les 90% restants renvoient une 404. L'adoption réelle est marginale — ce qui, vu l'absence d'adoption côté Google/OpenAI/Anthropic/ Perplexity, est cohérent.
2. Politiques des crawlers IA
GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot et Google-Extended sont les principaux crawlers qui alimentent les réponses IA. Décider de les autoriser ou non est un choix stratégique. Pourtant 95% des sites (19 sur 20) ne les mentionnent jamaisdans leur robots.txt — ils sont donc tolérés par défaut, sans décision consciente. Un seul site (ranxplorer.com) les nomme, et c'est pour les bloquer. Zéro site ne les autorise explicitement. Le marché n'a pas encore arbitré la question de l'accès des IA à son contenu.
3. Maturité schema.org
Les données structurées schema.org rendent un contenu machine-lisible — un signal direct pour les moteurs de réponse. Sur 19 pages d'accueil mesurables, 79% ont au moins un bloc JSON-LD, mais seulement 21% déclarent un SoftwareApplication(le balisage attendu d'un éditeur logiciel), et 11% une FAQPage en home. 21% n'ont aucunedonnée structurée. La majorité balise l'entité marque (Organization : 68%) mais néglige la description machine-lisible du produit.
4. État des citations LLM
La conséquence logique des trois constats précédents : le marché est peu cité par les LLMs. En dogfooding, nous avons testé notre propre marque (Brandyze) sur un jeu de requêtes B2B en français représentant nos cas d'usage cible (suivi de citations, analyse de marque, audit AEO…). Résultat mesuré : zéro citation de Brandyze par Gemini sur ces requêtes ICP — cohérent avec une marque jeune et un marché à maturité AEO faible.
Précision honnête : ce dernier point est un constat sur notre propre marque (audit interne Brandyze), pas une mesure de part-of-voice sur les 20sites du panel — mesurer les citations LLM de tiers nécessite un protocole dédié, requête par requête, que nous n'avons pas mené ici. Nous le documentons en transparence et ne le généralisons pas au marché.
Données brutes — 20 sites mesurés
Une ligne par site, l'observé tel quel. Transparence totale, y compris les cas non mesurables.
| Domaine | llms.txt | Crawlers IA | Organization | SoftwareApp | FAQPage | Schema détecté |
|---|---|---|---|---|---|---|
| semji.com | Absent | Non mentionnés | Non | Non | Non | WebSite, WebPage, BreadcrumbList, SearchAction |
| neocamino.com | Absent | Non mentionnés | Oui | Non | Non | Organization, WebSite, WebPage, ContactPoint, BreadcrumbList |
| merci-app.com | Absent | Non mentionnés | Oui | Non | Non | WebSite, Organization, ContactPoint |
| swello.com | Absent | Non mentionnés | Oui | Oui | Non | SoftwareApplication, Product, Offer, AggregateRating, Organization |
| mention.com | Absent | Non mentionnés | Oui | Non | Non | WebSite, WebPage, Organization, BreadcrumbList |
| agorapulse.com | Absent | Non mentionnés | Non | Non | Oui | FAQPage |
| plezi.co | Absent | Non mentionnés | n/a | n/a | n/a | Non mesuré (challenge anti-bot) |
| kolsquare.com | Réel | Non mentionnés | Oui | Non | Non | Organization |
| brevo.com | Absent | Non mentionnés | Oui | Oui | Non | SoftwareApplication, Offer, Organization, WebSite |
| iconosquare.com | Absent | Non mentionnés | Oui | Oui | Non | SoftwareApplication, Offer, AggregateRating, Review, Organization |
| digimind.com | Faux (HTML) | Non mentionnés | Oui | Non | Non | WebSite, WebPage, Organization, Person, Article |
| talkwalker.com | Vide / placeholder | Non mentionnés | Non | Non | Non | Aucun JSON-LD |
| haloscan.com | Absent | Non mentionnés | Oui | Non | Oui | FAQPage, Organization, ContactPoint |
| lemlist.com | Absent | Non mentionnés | Non | Non | Non | Aucun JSON-LD |
| waalaxy.com | Absent | Non mentionnés | Oui | Oui | Non | SoftwareApplication, Organization, Offer, WebSite |
| sarbacane.com | Absent | Non mentionnés | Non | Non | Non | Aucun JSON-LD |
| webmecanik.com | Absent | Non mentionnés | Oui | Non | Non | WebSite, WebPage, Organization, BreadcrumbList |
| ranxplorer.com | Absent | Bloqués | Oui | Non | Non | Product, Organization, AggregateRating, Review, BlogPosting, Brand |
| yooda.com | Absent | Non mentionnés | Oui | Non | Non | WebSite, WebPage, Organization, BreadcrumbList |
| visibrain.com | Absent | Non mentionnés | Non | Non | Non | Aucun JSON-LD |
Survolez une cellule llms.txt ou Crawlers IA pour voir le détail brut observé. « n/a » = page d'accueil non mesurable (challenge anti-bot), exclue du calcul schema.
Recommandations
Quatre actions, classées du gain le plus immédiat au plus structurant, pour un éditeur SaaS FR qui veut prendre l'avance AEO.
Décider sa politique crawlers IA
Ne pas laisser le choix par défaut. Ajouter dans robots.txt des directives explicites pour GPTBot, ClaudeBot, PerplexityBot et Google-Extended — autoriser si l'on vise les citations LLM. 95% du marché ne l'a pas encore fait.
Baliser le produit en SoftwareApplication
Seuls 21% des éditeurs déclarent un schema SoftwareApplication. Ajouter Organization + SoftwareApplication + Offer + FAQPage en JSON-LD rend le produit machine-lisible — un avantage net sur les 21% sans aucun schema.
Publier un llms.txt (signal communautaire bonus)
5% seulement servent un vrai llms.txt. Google ne l'utilise pas et OpenAI/Anthropic/Perplexity ne l'ont pas adopté — mais le déposer reste un quick-win quasi gratuit, observé par certains acteurs spécialisés (Kagi, You.com…) et utile en signal éditorial. À ne pas considérer comme un signal Google/OpenAI prioritaire.
Mesurer ses citations LLM en continu
On ne pilote que ce qu'on mesure. Suivre, requête par requête, si sa marque est citée par ChatGPT, Claude, Perplexity et Gemini — et face à quels concurrents — est le seul moyen de transformer ces optimisations en part-of-voice.
Questions fréquentes
Combien de SaaS marketing français ont un fichier llms.txt en 2026 ?
Sur 20 SaaS et outils marketing français mesurés le 2026-05-24, un seul (kolsquare.com) sert un fichier llms.txt réel et renseigné, soit 5%. En comptant les fichiers servis en 200 text/plain mais vides ou placeholder, on monte à 10% (2 sur 20). Les 90% restants renvoient une 404 ou une page HTML. L'adoption du standard llms.txt est donc quasi nulle sur le marché SaaS marketing FR début 2026.
Les éditeurs SaaS français autorisent-ils les crawlers IA (GPTBot, ClaudeBot) ?
Dans notre panel de 20 sites, 95% (19 sur 20) ne mentionnent aucun crawler IA dans leur robots.txt — ni GPTBot, ni ClaudeBot, ni PerplexityBot, ni Google-Extended. Par défaut, via la directive "User-agent: *", ces crawlers sont donc tolérés. Un seul site (ranxplorer.com) nomme explicitement les crawlers IA, et c'est pour les bloquer. Aucun site ne les autorise nommément. Conclusion : le marché n'a pas encore pris de décision consciente sur l'accès des IA à son contenu.
Quel pourcentage de SaaS marketing FR balisent leur page d'accueil avec SoftwareApplication ?
Sur 19 pages d'accueil réellement mesurables (1 site exclu pour cause de challenge anti-bot), 21% (4 sur 19) déclarent un schema.org SoftwareApplication — le balisage attendu pour un produit logiciel. 68% (13 sur 19) ont au moins un schema Organization, et 21% (4 sur 19) n'ont aucune donnée structurée du tout. La maturité schema est moyenne : la majorité balise l'entité marque, mais peu décrivent le produit de façon machine-lisible.
Qu'est-ce que l'AEO et pourquoi est-ce un enjeu en 2026 ?
L'AEO (Answer Engine Optimization) consiste à optimiser un contenu pour être cité comme source par les moteurs de réponse et les assistants IA (ChatGPT, Claude, Perplexity, Gemini, Google AI Overview), plutôt que pour ranker dans les 10 liens bleus classiques. En 2026, une part croissante des recherches B2B commence par un LLM qui ne renvoie pas de clic : être absent des réponses générées = perdre en notoriété. L'AEO repose sur deux piliers techniques principaux mesurables : l'accessibilité aux crawlers IA (robots.txt) et la machine-lisibilité (schema.org), auxquels s'ajoute le signal communautaire llms.txt — standard non adopté à ce jour par Google (confirmé par John Mueller et Gary Illyes fin 2025), ni par OpenAI, Anthropic ou Perplexity.
Cette étude est-elle reproductible ?
Oui. Chaque chiffre provient d'une requête HTTP réelle (curl GET HTTPS, user-agent desktop, timeout 20-30 s) réalisée le 2026-05-24 sur l'hôte fonctionnel de chaque domaine. Le tableau de données brut ci-dessous liste, ligne par ligne, l'observé pour les 20 sites : statut llms.txt, politique crawlers IA, types schema.org détectés. La mesure est faite côté serveur sans exécution JavaScript — c'est la limite assumée : un site injectant son JSON-LD au runtime apparaîtrait à tort « sans schema ». Vous pouvez reproduire chaque ligne en quelques minutes.
Mesurez où vous en êtes
Suivez vos propres citations LLM sur ChatGPT, Claude, Perplexity et Gemini — ou explorez notre hub veille & e-réputation.
Continuez votre exploration
Brandyze publie de la data sur les marques, créateurs et outils du marché FR. Tout est gratuit et data-driven.
Guides & blog
Guides AEO, marketing IA, dogfood case studies.
- → Être cité par ChatGPT 2026
- → Dogfood Brandyze sur 5 LLMs
- → Agence marketing zero-clics 2026
- → 30 contenus en 15 min avec IA