Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124


As “alucinações” acontecem quando modelos de IA geram respostas que parecem corretas, mas são inventadas. O RAG (Retrieval-Augmented Generation) ajuda a reduzir esse problema, pois permite que a IA busque informações em fontes externas e confiáveis antes de responder.
A seguir, tire suas dúvidas sobre:
RAG é a sigla para Retrieval-Augmented Generation, ou Geração Aumentada por Recuperação, em português. É uma técnica que permite que modelos de linguagem consultem informações externas antes de responder, em vez de depender apenas do que aprenderam durante o treinamento.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
O funcionamento do RAG pode parecer técnico à primeira vista, mas a lógica é bastante intuitiva quando explicada passo a passo. Em vez de responder apenas com base no que “aprendeu” durante o treinamento, o modelo de IA consulta informações externas antes de formular a resposta.
Tudo começa com a criação de uma base de conhecimento, que pode incluir manuais, políticas internas, artigos, relatórios ou FAQs em diferentes formatos (textos, PDFs ou bancos de dados etc.).
Para que o sistema processe esse conteúdo, os documentos são fragmentados em partes menores e convertidos em representações numéricas chamadas vetores, que representam o significado do texto e permitem que o sistema compreenda o contexto das informações, não apenas palavras isoladas.

Quando você faz uma pergunta, ela é convertida em um vetor. O sistema compara essa representação com as armazenadas na base de conhecimento para encontrar os trechos mais relevantes. Em outras palavras, ele busca as informações que se relacionam com a dúvida do usuário, mesmo que não utilizem exatamente as mesmas palavras.
Os trechos recuperados são combinados à pergunta do usuário em um único prompt enriquecido com informações externas, processo conhecido como augmentação. Assim, o sistema produz a resposta com sua capacidade de geração de texto junto aos dados recebidos, o que torna o resultado mais preciso, atualizado e fundamentado em fontes reais, reduzindo o risco de informações inventadas.
Não. O RAG está disponível para desenvolvedores através da API da OpenAI, Google, Anthropic e afins, que permitem acesso aos modelos das companhias, mas não necessariamente nos apps como ChatGPT, Gemini e Claude, por exemplo.
Neste caso, os modelos são utilizados em soluções próprias, como chatbots corporativos e assistentes internos, para processar as informações de bases de dados externas.
Não. O RAG não elimina completamente as alucinações, mas ajuda a reduzir o risco.
Elas acontecem quando o modelo precisa responder a algo pouco representado em seu treinamento e, para não “ficar em silêncio”, acaba preenchendo as lacunas com informações inventadas, ainda que pareçam convincentes.
Com o RAG, o processo ocorre de outra forma: antes de responder, o sistema vai até uma base de dados mantida pelo usuário ou empresa e recupera trechos que tenham relação com a pergunta.
No entanto, o resultado depende da qualidade dessas fontes. Se os dados estiverem desatualizados, imprecisos ou mal organizados, a resposta gerada também pode apresentar problemas.
A possibilidade de conectar modelos de IA a dados reais e atualizados abre espaço para:
Confira outros conteúdos do Canaltech:
VÍDEO: Por que tudo agora tem Inteligência Artificial gratuita? É de graça mesmo? E a paga?
Leia a matéria no Canaltech.