Os modelos da Cortex aceitam imagens?

Viewed 2

Posso enviar imagens/screenshots para um agente analisar?

1 Answers

Sim, diversos modelos da Cortex são multimodais (aceitam imagem + texto):

Modelos com visão nativa:

  • 🎭 Claude (Opus, Sonnet, Haiku 4.5+) — excelente em screenshots, documentos escaneados, gráficos
  • 🤖 GPT-5 (todas variantes exceto text-embedding) — suporta imagens em todas as versões
  • 🔮 Gemini (Pro, Flash) — multimodal nativo desde o início
  • Grok (4+) — aceita imagens
  • Qwen-VL, Pixtral (Mistral)

Casos de uso típicos:

  • Análise de contratos escaneados
  • Leitura de gráficos e dashboards
  • Triagem de screenshots de suporte
  • Verificação de documentos de identidade (com cuidado LGPD)
  • Acessibilidade: descrição de imagens para deficientes visuais

Para ativar: no seu agente, habilite a capacidade 👁️ Visão. O ícone de upload aparecerá para o usuário anexar imagens.

📖 Documentação completa na Wiki:

Related