RAG (Retrieval-Augmented Generation)
Définition mise à jour le 20 mai 2026Par Brandyze
Le RAG (Retrieval-Augmented Generation) est une architecture où un modèle de langage récupère d'abord des documents pertinents dans une base externe (vectorielle ou web), puis génère sa réponse en s'appuyant sur ces documents — réduisant les hallucinations et permettant des réponses à jour.
Définition détaillée
Le RAG combine deux étapes : (1) **Retrieval** — embed la requête de l'utilisateur, fait une recherche par similarité dans un index vectoriel (pgvector, Pinecone, Weaviate) ou un appel web (Serper, Tavily, Exa), récupère N documents pertinents (typiquement 5-20), (2) **Augmentation** — injecte ces documents dans le contexte du prompt envoyé au LLM, (3) **Generation** — le LLM produit la réponse en citant les sources. C'est l'architecture derrière Perplexity, ChatGPT browsing, Claude with web search, Gemini grounding, et la majorité des chatbots d'entreprise. Le RAG a deux conséquences AEO majeures : (a) **votre contenu doit être indexable** par les retrievers (texte propre, structure, headers) car c'est lui qui sera trouvé, (b) **votre contenu doit être citable** dans la phase de génération (structure factuelle, sources visibles).
Exemple concret
Vous demandez à Perplexity "meilleur outil français pour suivi citations LLM". Le retriever cherche sur le web (Brave + Bing), récupère 8 pages dont brandyze.fr/outil/suivi-citations-llm. Le LLM résume ces 8 pages et cite Brandyze avec lien [1].
Pourquoi c'est important pour le marketing 2026
L'AEO transforme la SERP : les LLM (ChatGPT, Perplexity, Claude, Gemini) deviennent une couche intermédiaire entre l'utilisateur et votre contenu. Maîtriser ces concepts est désormais aussi critique que comprendre le SEO l'a été en 2005-2015.
Brandyze et RAG
Brandyze utilise le RAG en interne via pgvector (Supabase) + Gemini Embedding 2 pour votre brand_context : quand vous générez un post, le LLM récupère vos guidelines, tone of voice et exemples passés avant de rédiger. Le studio Search Router agrège 3 providers (Serper + Exa + Tavily) pour fournir un retrieval web mutualisé.
Termes connexes
Questions fréquentes
RAG vs fine-tuning : que choisir ?
RAG pour données qui changent souvent (FAQ produit, docs internes, news) — pas de re-training. Fine-tuning pour style, ton ou domain knowledge stable. Dans 80% des cas business, RAG suffit.
Le RAG hallucine-t-il moins ?
Significativement moins quand les documents sources sont pertinents et que le prompt instruit explicitement le LLM à se baser dessus. Mais le RAG n'élimine pas 100% des hallucinations — un mauvais retrieval (documents off-topic) peut empirer les choses.
Sources externes citées
Maîtrisez RAG sur votre marque
Essai gratuit 7 jours sans CB. Tous les studios Brandyze débloqués pour appliquer ces concepts à vos cas d'usage réels.
Démarrer mon essai gratuit