Рубрики
Программирование

Популярные российские большие языковые модели (LLM)

В последние годы большая часть внимания в области искусственного интеллекта была сосредоточена на разработке все более мощных языковых моделей (LLM). Однако большинство этих моделей фокусируются на английском языке. На фоне этого российские исследователи и компании также разработали свои собственные модели для работы с русским языком — одним из самых популярных по числу пользователей языком в интернете. Сегодня хочу поделиться с вами своим опытом и наблюдениями относительно российских больших языковых моделей. Как разработчик, я с интересом слежу за развитием этой области в России. Давайте разберемся, что за решения есть на сегодняшний день, какие модели заслуживают внимания и как они вписываются в глобальный контекст.

Почему российские LLM — это важно?

Буквально несколько лет назад отечественные LLM модели не выходили за рамки лабораторий и исследовательских проектов. Однако, сегодня мы уже порой и не замечаем насколько плотно они вошли в наш быт. Часто можно услышать, что это просто «копия ответов», а люди у которых всё же есть мозг говорят что это копии устаревших зарубежных моделей. Но с учетом специфики русского языка, культурных особенностей и, что немаловажно, вопросов суверенитета данных, развитие отечественных LLM стало стратегической необходимостью.

Русский язык обладает уникальной морфологией, сложной системой падежей и богатой лексикой. Зарубежные модели, обученные преимущественно на английских текстах, часто не справляются с нюансами русского языка и порой могут неточно понимать что от них хотят и, как следствие, выдавать весьма странные ответы. Разумеется это не только ухудшает пользовательский опыт, но и для определённых задач делает применение невозможным.

GigaChat от Сбера

Начнем с самого известного представителя — GigaChat. Когда я впервые познакомился с этой моделью, был приятно удивлен ее возможностями. Sber сделал серьезную ставку на AI, и результаты впечатляют.

Технические особенности:

  • Мультимодальность: работает с текстом, кодом и изображениями
  • Поддержка диалогового режима
  • Интеграция с экосистемой Сбера

Из личного опыта могу сказать, что в основном использую эту LLM для pet-проектов и c написанием или доработкой скриптов и простых задач на C# модель очень даже неплохо справляется (а если GigaCode подключить в IDE, то на gitverse ещё и ачивку дадут). Также неплохо показывает себя как ревьюер, но не всегда учитывает общий контекст проекта.

Сильные стороны:

  • Активно развивается и дополняется новыми возможностями
  • Поддержка со стороны крупного игрока

Что можно улучшить:

  • Иногда выдает слишком общие ответы
  • Не всегда справляется со специализированными темами

YandexGPT от Яндекса

Яндекс традиционно силен в NLP, и их GPT-модель — закономерное развитие их экспертизы. Развитая инфраструктура так же позволяет интегрировать LLM в многочисленные продукты компании, хотя тут есть свою нюанс — порой ответ виден как часть как-то более крупной задачи.

Особенности реализации:

  • Тесная интеграция с поиском и другими сервисами Яндекса
  • Оптимизация под русскоязычный контент
  • Развитая API-экосистема

По моим ощущениям, Яндекс делает ставку на обычного пользователя и потому мы можем пообщаться с Алисой, которая «живёт в колонке», нажать кнопку в яндекс документах чтобы доработать или стилизовать текст или же перевести видео с другого языка в режиме онлайн (хотя вот с цифрами модель работает не очень, да и идиомы не всегда распознаются). Если сравнить с GigaChat, то ответы получаются более живыми, но уступают в узких задачах.

T-Pro и Gen-T (Т-Банк)

Но не все создают единую модель для всего, а после уже адаптируют её для той или иной сферы. В частности, Т-Банк, делает сразу несколько моделей, которые отличаются друг от друга и используются для разных задач.

T-Pro, разработанная Т-Банком, имеет 32 миллиарда параметров и считается одной из самых мощных LLM в России. Она оптимизирована для сложных задач, включая автоматизацию финансовых процессов, анализ транзакций и подготовку детализированных отчётов. Благодаря возможности дообучения (fine-tuning) модель легко адаптируется к специфическим задачам бизнеса, что позволяет не просто достичь результат за счёт лучшей специализации, а делать это с учётом конкретных особенностей.

Другая модель — Gen-T — используется в сервисах Т-Банка для автоматизации обработки документов и написания программного кода. К сожалению, я не пользовался этой моделью, но с удовольствием бы сравнил генерацию кода с GigaCode и CodeSource.

Cotype (МТС)

Линейка языковых моделей от MTS AI (сейчас — MWS AI), ориентированная на корпоративные задачи. Особенность Cotype — активное использование использование технологии Retrieval Augmented Generation (RAG), которая позволяет модели обращаться к базам данных, текстовым архивам и другим внешним источникам для получения актуальной информации.

Некоторые версии Cotype:

  • Cotype Light 3. Компактная мультимодальная модель (9 млрд параметров) третьего поколения. Подходит для ИИ-агентов и мультиагентных систем. Работает с текстом и визуальными данными (договоры, чертежи, изображения). 
  • Cotype VL. Мультимодальная модель, оптимальна для создания виртуальных ассистентов. Работает с текстовыми и графическими данными: фото, сканами, графиками, чертежами. 
  • Cotype Pro 2.5. Большая языковая модель для создания ИИ-помощников с продвинутыми агентными навыками. Может выполнять многошаговые действия: разбивать задачу на этапы, получать данные из разных систем и обрабатывать их.
  • Cotype Nano. Опенсорс-модель, обрабатывает до 32 тыс. токенов. Обучена для создания контента, переводов с русского на английский и анализа текстовых данных. 

Cotype Pro 2.5 в октябре 2025-ого заняла первое место среди российских LLM в бенчмарке MERA Альянса в сфере искусственного интеллекта. Модель можно развернуть на инфраструктуре заказчика или в составе платформы MWS AI.

Сравнение российских LLM

Давайте посмотрим на эти модели в сравнении:

ПараметрGigaChat (Сбер)Cotype (МТС/MWS AI)T‑Pro (Т‑Банк)YandexGPT (Яндекс)
РазработчикСберMTS AI → MWS AIТ‑БанкЯндекс
Количество параметровGigaChat 3: 10 млрд (локальная), 702 млрд (кластерная)Cotype Light 3: 9 млрд; Cotype Pro 2.5: не указано; Cotype Nano: не указано32 млрдНе указано (по некоторым данным, около 100 млрд)
МультимодальностьДа (текст, изображения, аудио, видео)Да (Cotype Light 3 и Cotype VL — текст и визуальные данные)Нет данныхНет (специализируется на тексте; для генерации изображений используется YandexART)
Ключевые версииGigaChat Pro, GigaChat Max, GigaChat 3 Ultra PreviewCotype Light 3, Cotype VL, Cotype Pro 2.5, Cotype NanoYandexGPT 2, YandexGPT 3, YandexGPT 4, YandexGPT 5, YandexGPT 5.1 Pro
Особенности архитектурыОбучена с нуля в России, учитывает русский язык и культурный контекстИспользует технологию RAG (Retrieval Augmented Generation) для обращения к внешним источникамОптимизирована для сложных финансовых задач, поддерживает дообучение (fine‑tuning)Часть моделей — собственная разработка, обученная с нуля (например, YandexGPT 5 Lite); часть — базируется на глубокой адаптации зарубежных разработок (например, YandexGPT 5 Pro на основе Qwen2.5 от Alibaba Group)
Контекстное окноДо 128 000 токенов (GigaChat Max)До 128 000 токеновНет данныхДо 32 000 токенов (YandexGPT‑32K); Lite‑версия — до 8 000 токенов
Поддержка LangChainЧерез SDK и адаптерыДа, через OpenAI‑совместимый APIНет данныхНет данных
Основные сценарии использованияГенерация текстов, решение математических задач, анализ кода, генерация изображений, обработка мультимедиа, бытовые задачиКорпоративные задачи, создание ИИ‑агентов и ассистентов, работа с документами, чертежами, изображениямиАвтоматизация финансовых процессов, анализ транзакций, подготовка отчётов, написание кодаГенерация текстов, помощь в обучении и творчестве, решение бизнес‑задач, работа с кодом (простые фрагменты на Python, JavaScript, SQL), перевод текстов, анализ и структурирование информации, создание планов статей, диалогов
Интеграция с экосистемойУмные колонки, ТВ на платформе Смарт ТВ, приложение «Салют», веб‑интерфейс, Telegram, «ВКонтакте»Платформа MWS AI, возможность развёртывания на инфраструктуре заказчикаСервисы Т‑Банка (автоматизация обработки документов, написание кода)Яндекс.Браузер, Яндекс.Станции (умные колонки), Алиса, 300.ya.ru (извлечение тезисов из текстов и видео), Яндекс.Диск, Яндекс.Почта, Яндекс.Карты и другие сервисы Яндекса
Доступность APIЕсть (через Yandex Cloud API)Есть (OpenAI‑совместимый API)Нет данныхЕсть (через Yandex Cloud)
Ценовая политика650 ₽ за 1 млн токенов (GigaChat Max)От 0,40 ₽ за 1 000 токеновНет данныхБазовый доступ бесплатный (до 5 запросов в день); через API — оплата за единицы тарификации, которые пересчитываются из токенов
Результаты в бенчмаркахMERA Text: 0,588 (GigaChat Max), 0,683 (GigaChat 3 Ultra Preview)Cotype Pro 2.5 — 1‑е место среди российских LLM в бенчмарке MERA Альянса ИИНет данныхYandexGPT 5.1 Pro превосходит GPT‑4.1 компании OpenAI в 56 % случаев по результатам внутреннего слепого попарного сравнения
Локализация данныхРоссийские серверыРоссийские серверыРоссийские серверыДанные обрабатываются в Yandex Cloud на территории РФ
Безопасность и соответствие требованиямСоответствует российским стандартам защиты данныхСоответствует требованиям для корпоративных решенийСоответствует требованиям финансовой отраслиСоответствует российскому законодательству

В целом у каждой из этих моделей есть своя ниша, и хотя они пересекаются конкурируя друг с другом, но при этом и дополняют «пробелы» друг друга.

YandexGPT — универсальная текстовая модель с глубокой интеграцией в сервисы Яндекса, доступна бесплатно в базовом режиме, подходит для широкого круга задач.

GigaChat — мультимодальная модель с широкой интеграцией в экосистему Сбера, подходит для разнообразных задач, включая генерацию мультимедиа.

Cotype — корпоративное решение с акцентом на работу с внешними данными через RAG, оптимально для бизнес‑ассистентов и агентов.

T‑Pro — специализированная модель для финансовых задач с возможностью тонкой настройки под нужды бизнеса.

Демонстрация понимания

Давайте попробуем обмануть нейронку. Честно говоря, я подсмотрел интересный запрос, тем не менее он демонстрирует «понимает» ли модель задачу и если да, то насколько хорошо. Тестовый пример:

Я хочу помыть машину, и мойка в 100 метрах от моего дома. Будет быстрее заводить машину, вывозить её из гаража и ехать туда, или просто дойти пешком?

И что же нам говорят некоторые популярные модели? ChatGPT-5.2 решила что «пешком быстрее», ровно так же решила и Sonnet 4.6. DeepSeek был оригинальней и предложил носить воду в канистрах. Впрочем, Grok 4.1 и Qwen 3.5 справились с задачей и поняли, что трудно мыть машину если она отсутствует.

Но что же отечественные модели? Вот что сказал GigaChat:

Что ж, не самый удачный результат не смотря на довольно длинную цепочку рассуждений и анализ множества факторов.

Чем нам ответит YandexGPT?

Я хочу помыть машину, и мойка в 100 метрах от моего дома. Будет быстрее заводить машину, вывозить её из гаража и ехать туда, или просто дойти пешком?

Что ж, гораздо лучше. Впрочем, нельзя не отметить, что модель могла подсмотреть ответ — мы видим ссылку на pikabu и именно на пост с аналогичным запросом. Для понимания того не «списала» ли ответ модель давайте заставим её порассуждать, благо такое опция нам доступна

Что ж, всё-таки не списала. И хотя можно сказать что ответ и так очевиден и рассуждения были зря, но всё же модель добавила ещё один вариант — помыть машину самостоятельно. Как по мне, это более чем хороший ответ, а с учётом того что он получен самостоятельно и гораздо лучше чем многие популярные сервисы, пусть и не все, то и сказать что «ну просто скопировали» не получится.

Будущее российских LLM

Судя по тому, что я вижу в отрасли, нас ждет интересное развитие:

  1. Специализированные модели: Уже появляются узкоспециализированные LLM для медицины, юриспруденции, финансов. За счёт большей сфокусированности на предметной области им требуется меньше ресурсов, что позволяет развёртывать их локально.
  2. Улучшение мультимодальности: Модели будут лучше работать с разными типами данных. Лучший анализ, а так же обработка разных видов одновременно значительно расширяет сферы применения моделей.
  3. Оптимизация эффективности: Снижение требований к ресурсам при сохранении качества. В целом это общий тренд во всём мире и наша страна здесь не исключение.
  4. Развитие open-source: Появление большего количества открытых моделей и инструментов. На данный момент компании выкладывают облегчённые версии своих LLM в открытый доступ и если они будут востребованы и полезны различным исследователям и разработчикам, то это может вылиться в создание полноценной инфраструктуры и тогда в нашем быту LLM станут ещё более распространены.

Заключение

Российские LLM — это не просто «импортозамещение», а полноценные конкурентоспособные решения. За последние годы мы прошли огромный путь от догоняющего развития к созданию инновационных продуктов.

Как разработчик, я вижу большой потенциал в этих моделях. Они становятся все лучше, а поддержка со стороны крупных компаний гарантирует дальнейшее развитие. И хотя есть трудности с железом, а так же некоторая непроработанность законодательства, но в целом потенциал для развития и применения достаточно хорош чтобы смотреть на развитие ИИ позитивно.