Какие модели ИИ существуют и как выбрать подходящую для бизнеса
GPT, Claude, Gemini, Llama — объясняем разницу на человеческом языке и помогаем выбрать под вашу задачу
Рынок моделей ИИ растёт быстрее, чем успеваешь за ним следить. Мы в eddp.ru разбирались в этом не для статьи — для себя. Делимся тем, что реально важно для бизнеса.
Почему выбор модели — это не технический вопрос
Когда компания покупает автомобиль для курьера, никто не берёт Ferrari. Не потому что Ferrari плохая — а потому что задача другая. С моделями ИИ ровно та же история.
Самая распространённая ошибка при первом знакомстве с ИИ — взять «самую мощную» и самую известную модель, потому что о ней слышали. В итоге платят за возможности, которые не используют, или получают инструмент, неудобный именно для своей задачи.
На выбор реально влияют три вещи: задача (что именно автоматизируете), бюджет (разовые вложения или абонентка) и приватность данных (можно ли отправлять их в облако). Остальное — детали.
Как устроен рынок: три лагеря
Чтобы не потеряться, полезно разделить всё многообразие на три группы.
Облачные гиганты
OpenAI (GPT), Anthropic (Claude), Google (Gemini) — работают по модели API: вы отправляете запрос, получаете ответ, платите за объём. Никакого железа, никакой установки. Зарегистрировался, получил ключ доступа — и работай. Данные при этом уходят на серверы вендора.
Открытые модели
Llama (Meta)*, Mistral (Франция), Qwen (Alibaba) — код и веса моделей открыты, скачивай бесплатно. Платить за каждый запрос не нужно. Но нужен собственный сервер, на котором модель будет работать. Данные никуда не уходят — всё остаётся у вас.
Российские разработки
GigaChat (Сбер) и YandexGPT — отдельная категория. Сильный русский язык, данные хранятся в российской юрисдикции, есть корпоративные тарифы с соглашениями об обработке персональных данных. Для компаний, работающих с чувствительными данными российских граждан, это может быть принципиально важно.
Коротко о главных игроках — без технического жаргона
GPT-5 / ChatGPT (OpenAI)
Флагман OpenAI с 2025 года — GPT-5 пришёл на смену GPT-4o и заметно сильнее в рассуждениях, коде и работе с длинными документами. Огромная экосистема интеграций, плагинов и обученных специалистов никуда не делась. За популярность по-прежнему приходится платить — не только деньгами, но и вниманием к тому, что именно отправляете в запросах. Хорош для широкого круга задач: тексты, анализ, код, работа с таблицами.
Claude (Anthropic)
Сильная сторона — работа с большими объёмами текста. Загрузить 200-страничный договор и попросить выделить ключевые риски — Claude справляется с этим лучше большинства конкурентов. Также отличается осторожностью в ответах: реже выдаёт уверенную чушь, чаще честно говорит «не знаю». Для юридических, финансовых и аналитических задач — один из лучших вариантов.
Gemini (Google)
Логичный выбор, если компания уже сидит в экосистеме Google: Gmail, Docs, Sheets, Meet. Интеграция нативная, без лишних телодвижений. Как самостоятельный инструмент — крепкий середняк, без явных слабостей и без явных суперсил.
Llama / Mistral (открытые модели)*
Главное преимущество — данные не покидают ваш сервер. Для компаний с чувствительной информацией это не опция, а требование. Качество современных открытых моделей вплотную приблизилось к коммерческим — Mistral Medium, например, по многим задачам не уступает GPT-4. Нужен сервер с видеокартой — об этом подробнее в следующей статье.
GigaChat / YandexGPT
Русский язык понимают лучше иностранных моделей — особенно специфическую лексику, профессиональный сленг, региональные особенности. Корпоративные тарифы позволяют заключить нормальное соглашение об обработке данных. Международных задач не решают — но если ваш бизнес работает только на российском рынке, это и не нужно.
Облако или свой сервер: считаем честно
Вот тот вопрос, который рано или поздно встаёт перед каждой компанией, которая начинает использовать ИИ всерьёз. И здесь есть конкретная математика.
Как считается стоимость в облаке
Облачные модели берут деньги за токены — условные единицы текста (примерно 1000 токенов = 750 слов). GPT-5 стоит около $15 за миллион входящих токенов и $60 за миллион исходящих (цифры на середину 2025 года — уточняйте на сайте OpenAI, тарифы меняются). Claude Sonnet — около $3 и $15 соответственно. На практике один типичный запрос с контекстом и ответом «съедает» 1000–3000 токенов.
Считаем: если сотрудники делают 500 запросов в день (небольшая активная команда), это ~15 000 запросов в месяц. При среднем расходе 2000 токенов на запрос — 30 миллионов токенов. Стоимость в GPT-5: около $450–900 в месяц, то есть 40 000–80 000 рублей — флагманская модель заметно дороже. Для экономии часть задач можно закрыть более дешёвыми моделями: GPT-5 mini или Claude Haiku.
Когда облако выгоднее
При нагрузке до 300–500 запросов в день облако почти всегда выгоднее. Нет капитальных затрат, не нужен администратор, модель всегда актуальная. Для старта и пилотного проекта — оптимальный выбор.
Когда свой сервер становится выгоднее
Точка перелома наступает примерно при 1000–2000 запросов в день — это уровень, когда месячный счёт за облако начинает переваливать за 30 000–50 000 рублей. Сервер с видеокартой, способный тянуть модель уровня Mistral или Llama 70B, стоит 300 000–600 000 рублей. Простая арифметика: при затратах 40 000 рублей в месяц на облако сервер окупается за 8–15 месяцев — и дальше работает практически бесплатно.
Есть и второй триггер для перехода на своё железо, не связанный с нагрузкой: приватность данных. Если в запросах фигурируют персональные данные клиентов, коммерческая тайна или внутренняя финансовая информация — облако становится риском вне зависимости от стоимости.
Промежуточный вариант
Гибридная схема работает так: рутинные задачи с нечувствительными данными — в облако (дёшево и быстро), задачи с конфиденциальными данными — на локальный сервер. Многие компании приходят именно к такой архитектуре.
Простой алгоритм выбора
Три вопроса, которые закрывают 80% случаев:
- Что автоматизируем? Тексты и общение — подойдут почти все модели. Анализ больших документов — Claude. Интеграция с Google Workspace — Gemini. Код — GPT-5 или Claude. Только русский язык — GigaChat или YandexGPT.
- Насколько данные чувствительны? Если в запросах будут персональные данные, финансовая или коммерческая информация — нужна либо локальная модель, либо корпоративный тариф с соглашением об обработке данных.
- Сколько запросов в день? До 500 — облако. От 1000–2000 — считайте окупаемость своего сервера. Между — смотрите на чувствительность данных.
Для удобства — краткая сравнительная таблица:
| Модель | Лучше всего для | Стоимость | Данные |
|---|---|---|---|
| GPT-5 | Универсальные задачи, код | От $15/млн токенов | Уходят в OpenAI |
| Claude | Документы, анализ, тексты | От $3/млн токенов | Уходят в Anthropic |
| Gemini | Экосистема Google | От $3.5/млн токенов | Уходят в Google |
| Llama / Mistral | Приватность, высокая нагрузка | Бесплатно + сервер | Остаются у вас |
| GigaChat / YandexGPT | Русский язык, российское право | От 0.5 руб/1000 токенов | Российская юрисдикция |
Вместо вывода
Универсальной «лучшей» модели не существует — есть подходящая под вашу конкретную задачу. Хорошая новость: большинство сервисов дают бесплатный тестовый период. Потратьте неделю на эксперимент с двумя-тремя вариантами — это лучше любого рейтинга.
И ещё одно наблюдение из собственного опыта: первая модель, которую попробуете, редко оказывается финальным выбором. Это нормально.
* Llama разработана компанией Meta**. ** Meta признана экстремистской организацией и запрещена на территории Российской Федерации.
Выбрали локальную модель — значит, нужен правильный сервер.
Мы в eddp.ru знаем, какое железо реально справляется с задачами ИИ — потому что сами через это прошли. Смотрите каталог или задайте вопрос — поможем подобрать под вашу нагрузку.
Следующая статья цикла:
«Сервер для ИИ: железо, облако или аренда» — разберём, какие GPU нужны для каких моделей, сколько стоит собственная инфраструктура и когда она окупается.

