Те же ответы ИИ, на 90% дешевле.
Один API перед OpenAI, Anthropic, Google, DeepSeek и ещё 5 провайдерами. Мы классифицируем каждый запрос, направляем его к нужной модели и кэшируем всё, что можно — оплата по факту, без подписки.
Реальная экономия на реальных запросах
Живые цифры из прода. То же качество ответа — доля стоимости.
«Объясни квантовую запутанность тремя предложениями.»
«Напиши на Python функцию сортировки списка.»
«Какая сейчас цена биткоина?»
Как работает умный роутинг
Под капотом — четыре шага, которые проходит каждый запрос через наш шлюз.
1. Классификация
2. Маршрутизация
3. Кэш + сжатие
4. Проверка
Создано для реальных задач
Подключите к своему коду или используйте как чат — тот же бэкенд, та же экономия.
160+ моделей
OpenAI, Anthropic, Google, Mistral, Groq, DeepSeek, xAI — один OpenAI-совместимый эндпоинт.
Каскадный роутинг
Сначала дешёвая модель, эскалация — только если верификатор отметил низкую уверенность. Платите за топ-уровень только когда он нужен.
Инструменты реального времени
Котировки, погода, веб-поиск, Wikipedia, крипта, валюты — подключены из коробки.
Честные цены
Каждый ответ показывает, сколько вы заплатили и сколько сэкономили. Без скрытых комиссий.
Подключите к своим агентам в одну строку
LangChain, Continue.dev, Aider, OpenWebUI — всё, что говорит на OpenAI API. Установщики в одну команду для популярных инструментов — когда выпустим; copy-paste base URL + API-ключ уже работает для всего остального.
Платите только за то, что используете.
Без подписок. $0.50 бесплатно при регистрации. Дальше — пополнение по мере необходимости. Без скрытых платежей.
Примеры для иллюстрации — фактический расход зависит от модели и числа токенов.
Базовый чат
gpt-4o-mini с кэш-дружелюбными промптами
~$0.0001 за сообщение
- Оплата по факту
- Единый OpenAI-совместимый API
Продвинутый чат
С инструментами: поиск, погода, рыночные данные
~$0.001 за сообщение
- Оплата по факту
- Единый OpenAI-совместимый API
Премиум-рассуждения
Модели класса gpt-4o и reasoning
~$0.005 за сообщение
- Оплата по факту
- Единый OpenAI-совместимый API
Частые вопросы
Как у вас на 90% дешевле, если я выбираю ту же модель?+
Три слоя поверх той же модели: (1) семантический кэш переиспользует ответы между пользователями для повторяющихся вопросов (бесплатные попадания), (2) сжатие промптов уменьшает число токенов до оплаты провайдеру, (3) prompt-кэширование Anthropic и OpenAI даёт в 10× более дешёвый вход.
Что на самом деле делает режим «Авто»?+
Классификатор читает ваш запрос и определяет тип задачи (код, математика, изображение, реальное время, чат). Затем роутер выбирает самую дешёвую модель, которая хорошо справляется: DeepSeek для кода, Grok-4.3 для «какая сейчас цена X» (нативный поиск в реальном времени), Gemini для длинного контекста, Claude Haiku для общего чата. В ответе всегда видно, какая модель использовалась.
Обязательно использовать «Авто»?+
Нет. Можно явно выбрать любую из 160+ моделей через OpenAI-совместимый API или в интерфейсе чата. «Авто» — это просто режим по умолчанию, который обычно экономит больше всего.
Это OpenAI-совместимо?+
Да — `POST https://api.mycheapai.com/v1/chat/completions` с той же структурой запроса, плюс стриминг. Используйте openai SDK, LangChain или что угодно ещё, поменяв одну env-переменную.
Как устроена оплата?+
Stripe Checkout для пополнений. Минимум $1, максимум $1000 за пополнение. $0.50 бесплатно при регистрации. Без подписки и месячных минимумов.
Попробуйте бесплатно
$0.50 кредита при регистрации. Без карты. Оплата по факту через Stripe, когда захотите больше.