O que é rerank e por que a Cortex usa?

Viewed 2

Vi menção a 'reranking' no RAG. O que é?

1 Answers

Reranking é uma segunda etapa de ordenação dos resultados de busca, mais precisa (e mais cara) que a busca inicial.

Como funciona o pipeline RAG na Cortex:

Pergunta → Vetoriza → Busca (BM25 + Vector)
             ↓
     Top-20 candidatos (rápido mas grosseiro)
             ↓
     RERANKING (modelo especializado)
             ↓
     Top-5 realmente relevantes
             ↓
     Injeta no contexto → LLM responde

Por que reranking importa:

  • A busca vetorial inicial é rápida mas não super precisa
  • Chunks vindos do top-20 podem ter falso-positivos (contexto parecido mas não útil)
  • O reranker (um cross-encoder como rerank-v4.0-pro) relê cada chunk E a pergunta, calculando relevância real
  • Resultado: chunks finais são muito mais precisos

Impacto: precisão do RAG sobe de ~70% para ~90%+ com reranking ativo. A Cortex faz isso automaticamente, você não precisa configurar.

📖 Documentação completa na Wiki:

Related