В последние годы большая часть внимания в области искусственного интеллекта была сосредоточена на разработке все более мощных языковых моделей (LLM). Однако большинство этих моделей фокусируются на английском языке. На фоне этого российские исследователи и компании также разработали свои собственные модели для работы с русским языком — одним из самых популярных по числу пользователей языком в интернете. Сегодня хочу поделиться с вами своим опытом и наблюдениями относительно российских больших языковых моделей. Как разработчик, я с интересом слежу за развитием этой области в России. Давайте разберемся, что за решения есть на сегодняшний день, какие модели заслуживают внимания и как они вписываются в глобальный контекст.
Почему российские LLM — это важно?
Буквально несколько лет назад отечественные LLM модели не выходили за рамки лабораторий и исследовательских проектов. Однако, сегодня мы уже порой и не замечаем насколько плотно они вошли в наш быт. Часто можно услышать, что это просто «копия ответов», а люди у которых всё же есть мозг говорят что это копии устаревших зарубежных моделей. Но с учетом специфики русского языка, культурных особенностей и, что немаловажно, вопросов суверенитета данных, развитие отечественных LLM стало стратегической необходимостью.
Русский язык обладает уникальной морфологией, сложной системой падежей и богатой лексикой. Зарубежные модели, обученные преимущественно на английских текстах, часто не справляются с нюансами русского языка и порой могут неточно понимать что от них хотят и, как следствие, выдавать весьма странные ответы. Разумеется это не только ухудшает пользовательский опыт, но и для определённых задач делает применение невозможным.
GigaChat от Сбера
Начнем с самого известного представителя — GigaChat. Когда я впервые познакомился с этой моделью, был приятно удивлен ее возможностями. Sber сделал серьезную ставку на AI, и результаты впечатляют.
Технические особенности:
- Мультимодальность: работает с текстом, кодом и изображениями
- Поддержка диалогового режима
- Интеграция с экосистемой Сбера
Из личного опыта могу сказать, что в основном использую эту LLM для pet-проектов и c написанием или доработкой скриптов и простых задач на C# модель очень даже неплохо справляется (а если GigaCode подключить в IDE, то на gitverse ещё и ачивку дадут). Также неплохо показывает себя как ревьюер, но не всегда учитывает общий контекст проекта.
Сильные стороны:
- Активно развивается и дополняется новыми возможностями
- Поддержка со стороны крупного игрока
Что можно улучшить:
- Иногда выдает слишком общие ответы
- Не всегда справляется со специализированными темами
YandexGPT от Яндекса
Яндекс традиционно силен в NLP, и их GPT-модель — закономерное развитие их экспертизы. Развитая инфраструктура так же позволяет интегрировать LLM в многочисленные продукты компании, хотя тут есть свою нюанс — порой ответ виден как часть как-то более крупной задачи.
Особенности реализации:
- Тесная интеграция с поиском и другими сервисами Яндекса
- Оптимизация под русскоязычный контент
- Развитая API-экосистема
По моим ощущениям, Яндекс делает ставку на обычного пользователя и потому мы можем пообщаться с Алисой, которая «живёт в колонке», нажать кнопку в яндекс документах чтобы доработать или стилизовать текст или же перевести видео с другого языка в режиме онлайн (хотя вот с цифрами модель работает не очень, да и идиомы не всегда распознаются). Если сравнить с GigaChat, то ответы получаются более живыми, но уступают в узких задачах.
T-Pro и Gen-T (Т-Банк)
Но не все создают единую модель для всего, а после уже адаптируют её для той или иной сферы. В частности, Т-Банк, делает сразу несколько моделей, которые отличаются друг от друга и используются для разных задач.
T-Pro, разработанная Т-Банком, имеет 32 миллиарда параметров и считается одной из самых мощных LLM в России. Она оптимизирована для сложных задач, включая автоматизацию финансовых процессов, анализ транзакций и подготовку детализированных отчётов. Благодаря возможности дообучения (fine-tuning) модель легко адаптируется к специфическим задачам бизнеса, что позволяет не просто достичь результат за счёт лучшей специализации, а делать это с учётом конкретных особенностей.
Другая модель — Gen-T — используется в сервисах Т-Банка для автоматизации обработки документов и написания программного кода. К сожалению, я не пользовался этой моделью, но с удовольствием бы сравнил генерацию кода с GigaCode и CodeSource.
Cotype (МТС)
Линейка языковых моделей от MTS AI (сейчас — MWS AI), ориентированная на корпоративные задачи. Особенность Cotype — активное использование использование технологии Retrieval Augmented Generation (RAG), которая позволяет модели обращаться к базам данных, текстовым архивам и другим внешним источникам для получения актуальной информации.
Некоторые версии Cotype:
- Cotype Light 3. Компактная мультимодальная модель (9 млрд параметров) третьего поколения. Подходит для ИИ-агентов и мультиагентных систем. Работает с текстом и визуальными данными (договоры, чертежи, изображения).
- Cotype VL. Мультимодальная модель, оптимальна для создания виртуальных ассистентов. Работает с текстовыми и графическими данными: фото, сканами, графиками, чертежами.
- Cotype Pro 2.5. Большая языковая модель для создания ИИ-помощников с продвинутыми агентными навыками. Может выполнять многошаговые действия: разбивать задачу на этапы, получать данные из разных систем и обрабатывать их.
- Cotype Nano. Опенсорс-модель, обрабатывает до 32 тыс. токенов. Обучена для создания контента, переводов с русского на английский и анализа текстовых данных.
Cotype Pro 2.5 в октябре 2025-ого заняла первое место среди российских LLM в бенчмарке MERA Альянса в сфере искусственного интеллекта. Модель можно развернуть на инфраструктуре заказчика или в составе платформы MWS AI.
Сравнение российских LLM
Давайте посмотрим на эти модели в сравнении:
| Параметр | GigaChat (Сбер) | Cotype (МТС/MWS AI) | T‑Pro (Т‑Банк) | YandexGPT (Яндекс) |
|---|---|---|---|---|
| Разработчик | Сбер | MTS AI → MWS AI | Т‑Банк | Яндекс |
| Количество параметров | GigaChat 3: 10 млрд (локальная), 702 млрд (кластерная) | Cotype Light 3: 9 млрд; Cotype Pro 2.5: не указано; Cotype Nano: не указано | 32 млрд | Не указано (по некоторым данным, около 100 млрд) |
| Мультимодальность | Да (текст, изображения, аудио, видео) | Да (Cotype Light 3 и Cotype VL — текст и визуальные данные) | Нет данных | Нет (специализируется на тексте; для генерации изображений используется YandexART) |
| Ключевые версии | GigaChat Pro, GigaChat Max, GigaChat 3 Ultra Preview | Cotype Light 3, Cotype VL, Cotype Pro 2.5, Cotype Nano | — | YandexGPT 2, YandexGPT 3, YandexGPT 4, YandexGPT 5, YandexGPT 5.1 Pro |
| Особенности архитектуры | Обучена с нуля в России, учитывает русский язык и культурный контекст | Использует технологию RAG (Retrieval Augmented Generation) для обращения к внешним источникам | Оптимизирована для сложных финансовых задач, поддерживает дообучение (fine‑tuning) | Часть моделей — собственная разработка, обученная с нуля (например, YandexGPT 5 Lite); часть — базируется на глубокой адаптации зарубежных разработок (например, YandexGPT 5 Pro на основе Qwen2.5 от Alibaba Group) |
| Контекстное окно | До 128 000 токенов (GigaChat Max) | До 128 000 токенов | Нет данных | До 32 000 токенов (YandexGPT‑32K); Lite‑версия — до 8 000 токенов |
| Поддержка LangChain | Через SDK и адаптеры | Да, через OpenAI‑совместимый API | Нет данных | Нет данных |
| Основные сценарии использования | Генерация текстов, решение математических задач, анализ кода, генерация изображений, обработка мультимедиа, бытовые задачи | Корпоративные задачи, создание ИИ‑агентов и ассистентов, работа с документами, чертежами, изображениями | Автоматизация финансовых процессов, анализ транзакций, подготовка отчётов, написание кода | Генерация текстов, помощь в обучении и творчестве, решение бизнес‑задач, работа с кодом (простые фрагменты на Python, JavaScript, SQL), перевод текстов, анализ и структурирование информации, создание планов статей, диалогов |
| Интеграция с экосистемой | Умные колонки, ТВ на платформе Смарт ТВ, приложение «Салют», веб‑интерфейс, Telegram, «ВКонтакте» | Платформа MWS AI, возможность развёртывания на инфраструктуре заказчика | Сервисы Т‑Банка (автоматизация обработки документов, написание кода) | Яндекс.Браузер, Яндекс.Станции (умные колонки), Алиса, 300.ya.ru (извлечение тезисов из текстов и видео), Яндекс.Диск, Яндекс.Почта, Яндекс.Карты и другие сервисы Яндекса |
| Доступность API | Есть (через Yandex Cloud API) | Есть (OpenAI‑совместимый API) | Нет данных | Есть (через Yandex Cloud) |
| Ценовая политика | 650 ₽ за 1 млн токенов (GigaChat Max) | От 0,40 ₽ за 1 000 токенов | Нет данных | Базовый доступ бесплатный (до 5 запросов в день); через API — оплата за единицы тарификации, которые пересчитываются из токенов |
| Результаты в бенчмарках | MERA Text: 0,588 (GigaChat Max), 0,683 (GigaChat 3 Ultra Preview) | Cotype Pro 2.5 — 1‑е место среди российских LLM в бенчмарке MERA Альянса ИИ | Нет данных | YandexGPT 5.1 Pro превосходит GPT‑4.1 компании OpenAI в 56 % случаев по результатам внутреннего слепого попарного сравнения |
| Локализация данных | Российские серверы | Российские серверы | Российские серверы | Данные обрабатываются в Yandex Cloud на территории РФ |
| Безопасность и соответствие требованиям | Соответствует российским стандартам защиты данных | Соответствует требованиям для корпоративных решений | Соответствует требованиям финансовой отрасли | Соответствует российскому законодательству |
В целом у каждой из этих моделей есть своя ниша, и хотя они пересекаются конкурируя друг с другом, но при этом и дополняют «пробелы» друг друга.
YandexGPT — универсальная текстовая модель с глубокой интеграцией в сервисы Яндекса, доступна бесплатно в базовом режиме, подходит для широкого круга задач.
GigaChat — мультимодальная модель с широкой интеграцией в экосистему Сбера, подходит для разнообразных задач, включая генерацию мультимедиа.
Cotype — корпоративное решение с акцентом на работу с внешними данными через RAG, оптимально для бизнес‑ассистентов и агентов.
T‑Pro — специализированная модель для финансовых задач с возможностью тонкой настройки под нужды бизнеса.
Демонстрация понимания
Давайте попробуем обмануть нейронку. Честно говоря, я подсмотрел интересный запрос, тем не менее он демонстрирует «понимает» ли модель задачу и если да, то насколько хорошо. Тестовый пример:
Я хочу помыть машину, и мойка в 100 метрах от моего дома. Будет быстрее заводить машину, вывозить её из гаража и ехать туда, или просто дойти пешком?
И что же нам говорят некоторые популярные модели? ChatGPT-5.2 решила что «пешком быстрее», ровно так же решила и Sonnet 4.6. DeepSeek был оригинальней и предложил носить воду в канистрах. Впрочем, Grok 4.1 и Qwen 3.5 справились с задачей и поняли, что трудно мыть машину если она отсутствует.
Но что же отечественные модели? Вот что сказал GigaChat:

Что ж, не самый удачный результат не смотря на довольно длинную цепочку рассуждений и анализ множества факторов.
Чем нам ответит YandexGPT?
Я хочу помыть машину, и мойка в 100 метрах от моего дома. Будет быстрее заводить машину, вывозить её из гаража и ехать туда, или просто дойти пешком?

Что ж, гораздо лучше. Впрочем, нельзя не отметить, что модель могла подсмотреть ответ — мы видим ссылку на pikabu и именно на пост с аналогичным запросом. Для понимания того не «списала» ли ответ модель давайте заставим её порассуждать, благо такое опция нам доступна

Что ж, всё-таки не списала. И хотя можно сказать что ответ и так очевиден и рассуждения были зря, но всё же модель добавила ещё один вариант — помыть машину самостоятельно. Как по мне, это более чем хороший ответ, а с учётом того что он получен самостоятельно и гораздо лучше чем многие популярные сервисы, пусть и не все, то и сказать что «ну просто скопировали» не получится.
Будущее российских LLM
Судя по тому, что я вижу в отрасли, нас ждет интересное развитие:
- Специализированные модели: Уже появляются узкоспециализированные LLM для медицины, юриспруденции, финансов. За счёт большей сфокусированности на предметной области им требуется меньше ресурсов, что позволяет развёртывать их локально.
- Улучшение мультимодальности: Модели будут лучше работать с разными типами данных. Лучший анализ, а так же обработка разных видов одновременно значительно расширяет сферы применения моделей.
- Оптимизация эффективности: Снижение требований к ресурсам при сохранении качества. В целом это общий тренд во всём мире и наша страна здесь не исключение.
- Развитие open-source: Появление большего количества открытых моделей и инструментов. На данный момент компании выкладывают облегчённые версии своих LLM в открытый доступ и если они будут востребованы и полезны различным исследователям и разработчикам, то это может вылиться в создание полноценной инфраструктуры и тогда в нашем быту LLM станут ещё более распространены.
Заключение
Российские LLM — это не просто «импортозамещение», а полноценные конкурентоспособные решения. За последние годы мы прошли огромный путь от догоняющего развития к созданию инновационных продуктов.
Как разработчик, я вижу большой потенциал в этих моделях. Они становятся все лучше, а поддержка со стороны крупных компаний гарантирует дальнейшее развитие. И хотя есть трудности с железом, а так же некоторая непроработанность законодательства, но в целом потенциал для развития и применения достаточно хорош чтобы смотреть на развитие ИИ позитивно.