Se voce ja perguntou pra um assistente de IA "qual o horario da minha loja?" e ele respondeu "das 9 as 18" mesmo voce nao tendo dito isso pra ele — eu te garanto que ele inventou. RAG e a tecnica que resolve esse problema, e e o motivo de assistentes virtuais serios funcionarem em producao.
<5%
taxa de alucinacao em sistemas RAG bem implementados (vs 15-30% em LLM puro).
Fonte: Stanford HELM benchmark
70%
das implementacoes corporativas de IA generativa em 2024 usam RAG.
Fonte: McKinsey · State of AI 2024
2-3×
mais relevancia de resposta quando KB e estruturada vs documento solto.
O que e RAG, em portugues claro
RAG (Retrieval-Augmented Generation) tem 3 passos: (1) o cliente manda pergunta, (2) o sistema busca trechos relevantes na sua base de conhecimento, (3) passa esses trechos para o LLM como contexto obrigatorio para gerar a resposta. A IA so pode usar o que voce deu.
RAG e o padrao de facto para LLMs em producao quando precisao factual importa. Sem RAG, voce nao tem como controlar o que a IA fala.
— Andrew Ng — DeepLearning.AI, 2024
Como o sistema "busca" no conhecimento
O sistema converte cada trecho da sua base em um vetor numerico (embedding) que representa o significado. A pergunta do cliente tambem vira vetor. A busca encontra os trechos mais similares semanticamente — nao por palavra-chave. Por isso "quanto cobra" encontra "qual o valor do servico".
Anatomia de uma KB que funciona
- Servicos: nome, descricao curta (1-2 frases), preco, duracao, requisitos.
- Horarios: por dia da semana, com excecoes (feriado, almoco).
- Politicas: cancelamento, remarcacao, sinal, garantia, formas de pagamento.
- FAQ: as 20 perguntas mais comuns, com resposta de 2-3 linhas.
- Localizacao: endereco, ponto de referencia, estacionamento, transporte.
- Diferenciais: o que te separa do concorrente em 1 paragrafo.
Regra de ouro: um topico por trecho. KB grande dividida em 200-500 trechos curtos funciona melhor que 5 documentos enormes.
Onde RAG ainda erra (e como mitigar)
| Problema | Causa | Como resolver |
|---|---|---|
| IA nao acha info que esta na KB | Texto mal redigido ou ambiguo | Reescreva com vocabulario do cliente |
| IA mistura contextos errados | Trechos muito similares competindo | Adicione contexto unico em cada (ex: "para clinica de dentista") |
| Resposta longa demais | KB com paragrafos enormes | Quebre em frases curtas com bullet points |
| IA cita preco antigo | KB desatualizada | Versione e atualize sempre que mudar (mensal) |
Quanto investir em KB no inicio
Comece com 20-30 trechos cobrindo os topicos mais comuns: servicos, precos, horarios, top 10 FAQ. Isso ja cobre 70-80% das mensagens. Conforme aparecerem perguntas novas, voce vai adicionando — o sistema mostra quais perguntas a IA nao soube responder pra voce priorizar.
A Ana gera KB inicial automaticamente a partir do seu site, Insta e PDFs. Em 5 minutos voce tem a base — depois e so revisar e adicionar especificos.
Perguntas frequentes
Sim. Treinar (fine-tuning) modifica o modelo, demora dias e custa caro. RAG so injeta contexto no momento da pergunta — barato, instantaneo e revertivel. Para 99% dos casos de PME, RAG resolve.


