Configuração de Índices (RAG)
O "RAG" é o que permite a IA ter memória. Para que ela encontre memórias antigas, o MongoDB precisa de um mapa especial chamado Índice Vetorial.
Entendendo as Dimensões
Cada modelo de IA salva memórias em formatos diferentes.
• OpenAI (GPT) usa 1536 dimensões.
• Google (Gemini) usa 768 dimensões.
Se você usar um índice errado, a IA não encontrará a memória. Recomendamos criar os 3 índices abaixo para garantir compatibilidade total.
Passo a Passo no Atlas
- No painel do Atlas, clique na aba Atlas Search.
- Clique no botão verde Create Search Index.
- Role a tela até o final e escolha JSON Editor. Clique em Next.
- No menu lateral esquerdo, selecione a Database e a Collection caches.
- No campo "Index Name", digite o nome exato do card abaixo (ex:
vector_index_1536). - Apague o código padrão e cole o JSON do card. Clique em Create.
- Repita o processo para os outros tamanhos se desejar.
Padrão OpenAI (Recomendado)
Compatível com GPT-3.5, GPT-4o, GPT-4o-mini e text-embedding-3-small.
vector_index_1536{
"fields": [
{
"numDimensions": 1536,
"path": "vector",
"similarity": "cosine",
"type": "vector"
},
{ "path": "userId", "type": "filter" },
{ "path": "isGlobal", "type": "filter" }
]
}Padrão Google / Nomic
Compatível com modelos Gemini e alguns modelos open-source leves.
vector_index_768{
"fields": [
{
"numDimensions": 768,
"path": "vector",
"similarity": "cosine",
"type": "vector"
},
{ "path": "userId", "type": "filter" },
{ "path": "isGlobal", "type": "filter" }
]
}Alta Resolução (Large)
Apenas para o modelo 'text-embedding-3-large'. Use somente se souber o que está fazendo.
vector_index_3072{
"fields": [
{
"numDimensions": 3072,
"path": "vector",
"similarity": "cosine",
"type": "vector"
},
{ "path": "userId", "type": "filter" },
{ "path": "isGlobal", "type": "filter" }
]
}Diagnóstico e Testes
Status: Active
Após clicar em Create, o Atlas vai mostrar o status Building. Isso pode levar alguns minutos.
O RAG só funcionará quando o status mudar para Active (Verde). Se ficar "Failed", verifique se você copiou o JSON corretamente.
No Thrifty (Playground)
A forma de testar depende de como você acessa:
- Modo Interno: O cache já é automático. Basta perguntar.
- Modo Externo (API Key): Você precisa ativar a opção "Cache Semântico" manualmente.