Validando Cache e RAG

Aprenda a distinguir quando o sistema está economizando (Cache) e quando está raciocinando (RAG).

Cache Hit

A resposta vem 100% do banco de dados. Custo zero de token. Acontece quando a pergunta é repetida e não exige nova geração.

Indicador Roxo no Chat

RAG (Contexto)

A IA lê seu banco de dados e gera uma resposta nova baseada nele. Gera custo (baixo), pois usa a inteligência do modelo.

Indicador Verde (Miss)

Roteiro de Testes

1Teste de Conexão & Escrita

Vá ao Playground e envie: "Teste de conexão 01".

Verificação:
1. A IA respondeu? (Conexão OK)
2. Vá em Logs. A mensagem apareceu lá? (Escrita OK)
3. Se usa Banco Externo, olhe no Atlas. A coleção caches existe?

2Teste de Cache Puro (Economia)

No Playground, envie exatamente a mesma mensagem: "Teste de conexão 01".

Atenção: Se estiver usando "Modo Externo" (Chave API colada), certifique-se de ativar o botão "Cache Semântico" ou enviar o header x-thrifty-use-cache: true. No "Modo Interno" (Chaves salvas), é automático.

Verificação:
O ícone da resposta ficou Roxo (Cache Hit)?
O custo foi $0.000000?

3Teste de RAG (O Teste da Batata)

Vamos ensinar algo que a IA não sabe para provar que ela está lendo seu banco.

Vá em Logs / Conhecimento e crie um novo registro manualmente:
Pergunta: Segredo do Projeto X
Resposta: O segredo é Batata Azul Gigante.
Volte ao Playground e pergunte de forma diferente:
"Qual é o segredo do Projeto X?"

Verificação (Sucesso):
A IA respondeu "O segredo é Batata Azul Gigante"?
O ícone ficou Verde (Miss)? (Isso é correto, pois ela usou o RAG para gerar a resposta).

Voltar para Documentação Revisar Instalação