RAG (Retrieval-Augmented Generation)
Définition mise à jour le 20 mai 2026Par Brandyze
Définition détaillée
Le RAG combine deux étapes : (1) **Retrieval** — embed la requête de l'utilisateur, fait une recherche par similarité dans un index vectoriel (pgvector, Pinecone, Weaviate) ou un appel web (Serper, Tavily, Exa), récupère N documents pertinents (typiquement 5-20), (2) **Augmentation** — injecte ces documents dans le contexte du prompt envoyé au LLM, (3) **Generation** — le LLM produit la réponse en citant les sources. C'est l'architecture derrière Perplexity, ChatGPT browsing, Claude with web search, Gemini grounding, et la majorité des chatbots d'entreprise. Le RAG a deux conséquences AEO majeures : (a) **votre contenu doit être indexable** par les retrievers (texte propre, structure, headers) car c'est lui qui sera trouvé, (b) **votre contenu doit être citable** dans la phase de génération (structure factuelle, sources visibles).
Exemple concret
Vous demandez à Perplexity "meilleur outil français pour suivi citations LLM". Le retriever cherche sur le web (Brave + Bing), récupère 8 pages dont brandyze.fr/outil/suivi-citations-llm. Le LLM résume ces 8 pages et cite Brandyze avec lien [1].
Pourquoi c'est important pour le marketing 2026
L'AEO transforme la SERP : les LLM (ChatGPT, Perplexity, Claude, Gemini) deviennent une couche intermédiaire entre l'utilisateur et votre contenu. Maîtriser ces concepts est désormais aussi critique que comprendre le SEO l'a été en 2005-2015.
Brandyze et RAG
Brandyze utilise le RAG en interne via pgvector (Supabase) + Gemini Embedding 2 pour votre brand_context : quand vous générez un post, le LLM récupère vos guidelines, tone of voice et exemples passés avant de rédiger. Le studio Search Router agrège 3 providers (Serper + Exa + Tavily) pour fournir un retrieval web mutualisé.
Termes connexes
Questions fréquentes
RAG vs fine-tuning : que choisir ?
RAG pour données qui changent souvent (FAQ produit, docs internes, news) — pas de re-training. Fine-tuning pour style, ton ou domain knowledge stable. Dans 80% des cas business, RAG suffit.
Le RAG hallucine-t-il moins ?
Significativement moins quand les documents sources sont pertinents et que le prompt instruit explicitement le LLM à se baser dessus. Mais le RAG n'élimine pas 100% des hallucinations — un mauvais retrieval (documents off-topic) peut empirer les choses.
Sources externes citées
Maîtrisez RAG sur votre marque
Essai gratuit 7 jours sans CB. Tous les studios Brandyze débloqués pour appliquer ces concepts à vos cas d'usage réels.
Démarrer mon essai gratuit