Qual modelo tem maior janela de contexto?

Viewed 2

Preciso processar documentos muito longos. Qual modelo escolher?

1 Answers

Ranking de janelas de contexto entre modelos da Cortex:

Modelo Janela Equivalente
Grok 4.1 Fast 2.000.000 tokens ~3.000 páginas
Claude Sonnet 4.6 1.000.000 tokens ~1.500 páginas
Claude Opus 4.7 1.000.000 tokens ~1.500 páginas
Gemini 3 Pro 1.000.000 tokens ~1.500 páginas
GPT-5 / GPT-5.4 128.000 - 400.000 ~200-600 páginas
Claude Haiku 4.5 200.000 tokens ~300 páginas
GPT-5-mini 128.000 tokens ~200 páginas

Dicas importantes:

  • Janela grande ≠ melhor memória sempre. Modelos podem esquecer o meio de documentos muito longos (lost in the middle).
  • Para documentos muito grandes, RAG ainda é melhor que contexto completo (busca só o relevante).
  • Custo é proporcional aos tokens — documentos longos custam caro. Avalie se realmente precisa de tudo.

📖 Documentação completa na Wiki:

Related