Vejo 'tokens' em todo lugar. O que é e como isso afeta meu custo?
Vejo 'tokens' em todo lugar. O que é e como isso afeta meu custo?
Token é a unidade de processamento dos LLMs — algo entre letra e palavra.
Regra prática em português:
cortex → 1 tokeninteligência artificial → 4 tokensJoão → 2 tokens (caracteres especiais custam mais)O que conta como token no custo:
| Tipo | O que é | Normalmente |
|---|---|---|
| Input | Prompt + RAG + histórico | 500-20.000/req |
| Output | Resposta gerada | 100-2.000/req |
| Reasoning | Pensamento interno (thinking) | 0-vários milhares |
| Cached | Prompt repetido do cache | 50-90% mais barato |
Custos aproximados (por 1M tokens):
Saídas são tipicamente 3-5x mais caras que entradas.
📖 Documentação completa na Wiki: