Счётчик токенов и стоимости
Оценка стоимости запроса для Claude, GPT-4o, DeepSeek, Gemini, YandexGPT и GigaChat с учётом prompt caching, batch API и multi-turn диалогов. Эвристика ±10% для всех языков, точный токенайзер для GPT по запросу. Локально в браузере.
| Модель | Контекст | Скорость | Задержка | Сумма USD | Сумма ₽ |
|---|---|---|---|---|---|
| Модель | Цена запроса USD | Цена запроса ₽ | Запросов в месяц | Полная USD | Полная ₽ |
Цены за 1M токенов. Прайс обновлён —. Источник: публичные тарифы вендоров. Файл js/prices.json можно править руками.
Как считается и что важно понимать
Эвристика на смеси языков (по умолчанию):
- Латиница:
1 токен ≈ 4 символа - Кириллица:
1 токен ≈ 2 символа - Цифры и пунктуация: ≈ 2 символа на токен
- Пробелы: ≈ 4 символа на токен
Точность ±10%. Для платёжной точности используйте tiktoken у OpenAI или POST /v1/messages/count_tokens у Anthropic — оба требуют серверной части или API ключа.
Prompt Caching — у Claude, GPT-4o, Gemini, DeepSeek повторяющийся system-промпт кэшируется на стороне вендора. Цена кэшированной части — в 2-10 раз ниже базовой. Если вы используете один системный промпт во всех запросах — большая часть input уйдёт в кэш.
- Claude: cached = 10% цены
- GPT-4o, Gemini Batch: 50%
- DeepSeek cache hit: ~25%
- YandexGPT, GigaChat: prompt caching не поддерживают
Batch API — у OpenAI и Anthropic асинхронный режим со скидкой 50% (ответ в течение 24ч). Подходит для аналитики, бэкенд-задач, бэкап-обработки.
Multi-turn диалог: в каждом следующем запросе вы отправляете всю историю предыдущих сообщений. Калькулятор моделирует накопление: turn N input = system + (N-1)×(user+assistant) + new user. Это объясняет, почему длинные диалоги быстро становятся дорогими.
Скорость и задержка — приблизительные значения из публичных бенчмарков. tps (tokens/sec) важен для UX чатов, ttft — задержка до первого токена.