O que são tokens e como são contados?

Viewed 2

Vejo 'tokens' em todo lugar. O que é e como isso afeta meu custo?

1 Answers

Token é a unidade de processamento dos LLMs — algo entre letra e palavra.

Regra prática em português:

  • 1.000 tokens ≈ 750 palavras (3-4 caracteres por token em média)
  • cortex → 1 token
  • inteligência artificial → 4 tokens
  • João → 2 tokens (caracteres especiais custam mais)

O que conta como token no custo:

Tipo O que é Normalmente
Input Prompt + RAG + histórico 500-20.000/req
Output Resposta gerada 100-2.000/req
Reasoning Pensamento interno (thinking) 0-vários milhares
Cached Prompt repetido do cache 50-90% mais barato

Custos aproximados (por 1M tokens):

  • Econômico (haiku, mini, nano) — US$ 0,05 - 1,50 input
  • Médio (sonnet, gpt-5, gemini-pro) — US$ 3-10 input
  • Premium (opus, gpt-5.4, o3) — US$ 15-75 input

Saídas são tipicamente 3-5x mais caras que entradas.

📖 Documentação completa na Wiki: