Умный роутинг · 160+ моделей · OpenAI-совместимо

Те же ответы ИИ, на 90% дешевле.

Один API перед OpenAI, Anthropic, Google, DeepSeek и ещё 5 провайдерами. Мы классифицируем каждый запрос, направляем его к нужной модели и кэшируем всё, что можно — оплата по факту, без подписки.

Маршрутизация по:OpenAIAnthropicGoogle GeminiMistralDeepSeekGroqxAI

Реальная экономия на реальных запросах

Живые цифры из прода. То же качество ответа — доля стоимости.

Чат / вопросы

«Объясни квантовую запутанность тремя предложениями.»

Напрямую у провайдера$0.04
MY CHEAP AI$0.0036
экономия 91%
маршрутclaude-haiku-4-5
Код

«Напиши на Python функцию сортировки списка.»

Напрямую у провайдера$0.03
MY CHEAP AI$0.0026
экономия 91%
маршрутdeepseek-chat
Данные в реальном времени

«Какая сейчас цена биткоина?»

Напрямую у провайдера$0.01
MY CHEAP AI$0.0014
экономия 91%
маршрутgrok-4.3 (xai)

Как работает умный роутинг

Под капотом — четыре шага, которые проходит каждый запрос через наш шлюз.

1. Классификация

Быстрый матчер размечает каждый запрос: код, рассуждения, vision, реальное время, длинный контекст или обычный чат.

2. Маршрутизация

Выбираем самую дешёвую модель, которая хорошо справляется: DeepSeek для кода, Grok для живых данных, Gemini для огромного контекста.

3. Кэш + сжатие

Повторяющиеся вопросы попадают в семантический кэш. Длинные промпты сжимаются. Статичные system-сообщения используют prompt-кэширование на стороне провайдера.

4. Проверка

Верификатор оценивает ответ. Если качество низкое — эскалируем к более сильной модели, но только когда нужно.

Создано для реальных задач

Подключите к своему коду или используйте как чат — тот же бэкенд, та же экономия.

160+ моделей

OpenAI, Anthropic, Google, Mistral, Groq, DeepSeek, xAI — один OpenAI-совместимый эндпоинт.

Каскадный роутинг

Сначала дешёвая модель, эскалация — только если верификатор отметил низкую уверенность. Платите за топ-уровень только когда он нужен.

Инструменты реального времени

Котировки, погода, веб-поиск, Wikipedia, крипта, валюты — подключены из коробки.

Честные цены

Каждый ответ показывает, сколько вы заплатили и сколько сэкономили. Без скрытых комиссий.

Подключите к своим агентам в одну строку

LangChain, Continue.dev, Aider, OpenWebUI — всё, что говорит на OpenAI API. Установщики в одну команду для популярных инструментов — когда выпустим; copy-paste base URL + API-ключ уже работает для всего остального.

Платите только за то, что используете.

Без подписок. $0.50 бесплатно при регистрации. Дальше — пополнение по мере необходимости. Без скрытых платежей.

Примеры для иллюстрации — фактический расход зависит от модели и числа токенов.

Базовый чат

gpt-4o-mini с кэш-дружелюбными промптами

~$0.0001 за сообщение

  • Оплата по факту
  • Единый OpenAI-совместимый API

Продвинутый чат

С инструментами: поиск, погода, рыночные данные

~$0.001 за сообщение

  • Оплата по факту
  • Единый OpenAI-совместимый API

Премиум-рассуждения

Модели класса gpt-4o и reasoning

~$0.005 за сообщение

  • Оплата по факту
  • Единый OpenAI-совместимый API

Частые вопросы

Как у вас на 90% дешевле, если я выбираю ту же модель?+

Три слоя поверх той же модели: (1) семантический кэш переиспользует ответы между пользователями для повторяющихся вопросов (бесплатные попадания), (2) сжатие промптов уменьшает число токенов до оплаты провайдеру, (3) prompt-кэширование Anthropic и OpenAI даёт в 10× более дешёвый вход.

Что на самом деле делает режим «Авто»?+

Классификатор читает ваш запрос и определяет тип задачи (код, математика, изображение, реальное время, чат). Затем роутер выбирает самую дешёвую модель, которая хорошо справляется: DeepSeek для кода, Grok-4.3 для «какая сейчас цена X» (нативный поиск в реальном времени), Gemini для длинного контекста, Claude Haiku для общего чата. В ответе всегда видно, какая модель использовалась.

Обязательно использовать «Авто»?+

Нет. Можно явно выбрать любую из 160+ моделей через OpenAI-совместимый API или в интерфейсе чата. «Авто» — это просто режим по умолчанию, который обычно экономит больше всего.

Это OpenAI-совместимо?+

Да — `POST https://api.mycheapai.com/v1/chat/completions` с той же структурой запроса, плюс стриминг. Используйте openai SDK, LangChain или что угодно ещё, поменяв одну env-переменную.

Как устроена оплата?+

Stripe Checkout для пополнений. Минимум $1, максимум $1000 за пополнение. $0.50 бесплатно при регистрации. Без подписки и месячных минимумов.

Попробуйте бесплатно

$0.50 кредита при регистрации. Без карты. Оплата по факту через Stripe, когда захотите больше.

Без подпискиОтмена в любой моментОплата через Stripe