Validando Cache e RAG
Aprenda a distinguir quando o sistema está economizando (Cache) e quando está raciocinando (RAG).
Cache Hit
A resposta vem 100% do banco de dados. Custo zero de token. Acontece quando a pergunta é repetida e não exige nova geração.
Indicador Roxo no Chat
RAG (Contexto)
A IA lê seu banco de dados e gera uma resposta nova baseada nele. Gera custo (baixo), pois usa a inteligência do modelo.
Indicador Verde (Miss)
Roteiro de Testes
1Teste de Conexão & Escrita
Vá ao Playground e envie: "Teste de conexão 01".
Verificação:
1. A IA respondeu? (Conexão OK)
2. Vá em Logs. A mensagem apareceu lá? (Escrita OK)
3. Se usa Banco Externo, olhe no Atlas. A coleção
1. A IA respondeu? (Conexão OK)
2. Vá em Logs. A mensagem apareceu lá? (Escrita OK)
3. Se usa Banco Externo, olhe no Atlas. A coleção
caches existe?2Teste de Cache Puro (Economia)
No Playground, envie exatamente a mesma mensagem: "Teste de conexão 01".
Atenção: Se estiver usando "Modo Externo" (Chave API colada), certifique-se de ativar o botão "Cache Semântico" ou enviar o header
x-thrifty-use-cache: true. No "Modo Interno" (Chaves salvas), é automático.Verificação:
O ícone da resposta ficou Roxo (Cache Hit)?
O custo foi $0.000000?
O ícone da resposta ficou Roxo (Cache Hit)?
O custo foi $0.000000?
3Teste de RAG (O Teste da Batata)
Vamos ensinar algo que a IA não sabe para provar que ela está lendo seu banco.
- Vá em Logs / Conhecimento e crie um novo registro manualmente:
Pergunta:Segredo do Projeto X
Resposta:O segredo é Batata Azul Gigante. - Volte ao Playground e pergunte de forma diferente:
"Qual é o segredo do Projeto X?"
Verificação (Sucesso):
A IA respondeu "O segredo é Batata Azul Gigante"?
O ícone ficou Verde (Miss)? (Isso é correto, pois ela usou o RAG para gerar a resposta).
A IA respondeu "O segredo é Batata Azul Gigante"?
O ícone ficou Verde (Miss)? (Isso é correto, pois ela usou o RAG para gerar a resposta).