Configuração de Índices (RAG)

O "RAG" é o que permite a IA ter memória. Para que ela encontre memórias antigas, o MongoDB precisa de um mapa especial chamado Índice Vetorial.

Entendendo as Dimensões

Cada modelo de IA salva memórias em formatos diferentes.
OpenAI (GPT) usa 1536 dimensões.
Google (Gemini) usa 768 dimensões.
Se você usar um índice errado, a IA não encontrará a memória. Recomendamos criar os 3 índices abaixo para garantir compatibilidade total.

Passo a Passo no Atlas

  1. No painel do Atlas, clique na aba Atlas Search.
  2. Clique no botão verde Create Search Index.
  3. Role a tela até o final e escolha JSON Editor. Clique em Next.
  4. No menu lateral esquerdo, selecione a Database e a Collection caches.
  5. No campo "Index Name", digite o nome exato do card abaixo (ex: vector_index_1536).
  6. Apague o código padrão e cole o JSON do card. Clique em Create.
  7. Repita o processo para os outros tamanhos se desejar.

Padrão OpenAI (Recomendado)

Compatível com GPT-3.5, GPT-4o, GPT-4o-mini e text-embedding-3-small.

Nome:vector_index_1536
{
  "fields": [
    {
      "numDimensions": 1536,
      "path": "vector",
      "similarity": "cosine",
      "type": "vector"
    },
    { "path": "userId", "type": "filter" },
    { "path": "isGlobal", "type": "filter" }
  ]
}

Padrão Google / Nomic

Compatível com modelos Gemini e alguns modelos open-source leves.

Nome:vector_index_768
{
  "fields": [
    {
      "numDimensions": 768,
      "path": "vector",
      "similarity": "cosine",
      "type": "vector"
    },
    { "path": "userId", "type": "filter" },
    { "path": "isGlobal", "type": "filter" }
  ]
}

Alta Resolução (Large)

Apenas para o modelo 'text-embedding-3-large'. Use somente se souber o que está fazendo.

Nome:vector_index_3072
{
  "fields": [
    {
      "numDimensions": 3072,
      "path": "vector",
      "similarity": "cosine",
      "type": "vector"
    },
    { "path": "userId", "type": "filter" },
    { "path": "isGlobal", "type": "filter" }
  ]
}

Diagnóstico e Testes

Status: Active

Após clicar em Create, o Atlas vai mostrar o status Building. Isso pode levar alguns minutos.

O RAG só funcionará quando o status mudar para Active (Verde). Se ficar "Failed", verifique se você copiou o JSON corretamente.

No Thrifty (Playground)

A forma de testar depende de como você acessa:

  • Modo Interno: O cache já é automático. Basta perguntar.
  • Modo Externo (API Key): Você precisa ativar a opção "Cache Semântico" manualmente.
Ir para Laboratório de TestesAprenda a diferenciar Cache Hit vs RAG e valide sua instalação.