Март 2026   |   Обзор события   | 8

Суверенный ИИ: отказ от готовых моделей ради независимости и роста затрат на GPU

Стратегия создания суверенного ИИ в России требует отказа от готовых решений в пользу разработки моделей с нуля, что гарантирует независимость от внешних ограничений. «Сбер» инвестирует в собственные вычислительные мощности и оцифровку национальных данных, чтобы обеспечить долгосрочную устойчивость бизнеса и точное отражение культурных реалий.

ИСХОДНЫЙ НАРРАТИВ

По данным РБК, стратегия создания суверенного искусственного интеллекта в России строится на полном контроле над этапом предобучения моделей. Антон Фролов, руководитель блока «Развитие генеративного ИИ» в Сбере, утверждает, что только собственный путь разработки гарантирует качество решения и защиту от внешних рисков, включая внезапное ограничение доступа к технологиям. Компания отказалась от использования готовых открытых архитектур в пользу создания модели с нуля, что требует значительных вычислительных мощностей, но обеспечивает независимость фундаментальных знаний системы.

Подход «Сбера» предполагает, что попытка модифицировать чужие open-source модели несет угрозу разрушения базовой логики нейросети при адаптации. Зависимость от внешних разработчиков создает уязвимость: доступ к исходному коду или новым версиям может быть прекращен в любой момент. Собственный контроль над процессом претрейна (предобучения) становится важным фактором для построения устойчивой экосистемы, способной работать в долгосрочной перспективе без сбоев.

Баланс данных и культурный контекст

Разработка национальной модели не означает полного отказа от глобального контента. Эксперты отмечают, что отказ от использования англоязычных данных при обучении привел бы к снижению качества системы, так как основная часть мировой информации хранится на английском языке. Стратегия заключается не в исключении иностранного контента, а в его тщательной фильтрации, очистке и взвешивании. Приоритет отдается российским текстам, культурным реалиям и локальным знаниям, чтобы система формировала ответы через призму национальной идентичности.

Существует объективная проблема дефицита качественных российских данных. Нейросети, обученные на смешанных массивах, могут выдавать результаты, основанные на западных культурных кодах. Например, при запросе на генерацию изображения Винни-Пуха система может воспроизвести образ героя Disney, а не персонажа советской мультипликации. Решение этой задачи лежит в плоскости активного оцифровывания архивов, библиотек и исторических документов, которые десятилетиями существовали только в бумажном виде.

Отрасль и научное сообщество уже работают над расширением российского массива данных. Антон Фролов подчеркивает, что для развития любых нейросетей объем доступной информации всегда будет недостаточным. Увеличение количества инициатив по обогащению данных напрямую влияет на качество конечного продукта. Суверенность в данном контексте рассматривается как инструмент усиления национальной идентичности и понимания специфических культурных кодов.

Экономические и технологические последствия

Выбор пути самостоятельного обучения модели с нуля влечет за собой существенное увеличение затрат на инфраструктуру. Для реализации стратегии требуется значительно больше GPU (графических процессоров), чем при использовании готовых решений. Эти инвестиции оправданы необходимостью сохранить контроль над ключевым технологическим этапом и избежать зависимости от внешних поставщиков.

Рынок сталкивается с вызовом нехватки специализированных вычислительных ресурсов, однако альтернативой в виде использования чужих моделей является риск потери функциональности и доступа. Бизнес-логика «Сбера» строится на том, что высокая стоимость входа компенсируется долгосрочной устойчивостью и отсутствием рисков блокировки.

ПараметрИспользование открытых моделейСобственная разработка с нуля
ЗависимостьВысокая (риск закрытия доступа)Низкая (полный контроль)
РесурсоемкостьОтносительно низкаяВысокая (требуется много GPU)
Качество знанийРиск искажения при адаптацииСохранение фундаментальной логики
Культурный кодОриентация на западные данныеПриоритет российским реалиям

Ситуация требует постоянного мониторинга доступности данных и вычислительных мощностей. Для компаний, планирующих внедрение подобных технологий, ключевым фактором становится оценка баланса между стоимостью разработки и рисками зависимости от иностранных решений. Текущая динамика показывает, что отрасль движется в сторону создания собственных баз данных и инфраструктуры, что потребует времени и дополнительных инвестиций.

Дальнейшее развитие ситуации будет зависеть от темпов оцифровки национального наследия и способности отрасли обеспечить необходимый объем вычислительных ресурсов. Детальный анализ экономических моделей и технологических дорожных карт поможет понять, как именно изменится ландшафт рынка ИИ в ближайшие годы.

АНАЛИТИЧЕСКИЙ РАЗБОР

Цена суверенитета: от кода к физическим ресурсам

Стратегия создания суверенного искусственного интеллекта в России эволюционирует. Если ранее фокус смещался на отказ от чужих архитектур ради независимости кода, то сейчас на первый план выходит борьба за физические ресурсы и данные. Подход, реализуемый крупными игроками, такими как Сбер, предполагает полный контроль над этапом предобучения моделей. Это решение диктуется не только желанием избежать блокировок доступа к технологиям, но и необходимостью гарантировать качество фундаментальных знаний системы, которые невозможно корректно адаптировать, просто модифицируя чужие нейросети. Попытка изменить базовую логику готовой модели несет риск нарушения её внутренней целостности, что делает путь разработки с нуля единственным вариантом для построения устойчивой экосистемы.

Однако реализация этой стратегии сталкивается с новыми, более жесткими ограничениями. Глобальный рынок полупроводников переживает структурный дисбаланс, вызванный бумом спроса на инфраструктуру ИИ. Производители памяти перенаправляют мощности на выпуск высокопроизводительных компонентов, что создает дефицит стандартной памяти и ведет к росту цен, который, по прогнозам, сохранится до второй половины 2027 года [!]. Для российских компаний, зависящих от импорта, это означает необходимость закладывать существенный рост издержек в бюджеты или снижать характеристики выпускаемой техники.

Важный нюанс: Суверенитет в сфере ИИ сегодня определяется не только наличием собственного алгоритма, но и способностью обеспечить физический доступ к дефицитным компонентам в условиях глобального дисбаланса спроса и предложения.

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

Экономика высоких ставок и физический дефицит

Финансовая модель суверенного ИИ перестает быть абстрактной и обретает конкретные цифры. Сбербанк планирует удвоить инвестиции в развитие искусственного интеллекта до 350 млрд рублей в 2026 году. Общий объем вложений за период с 2024 по 2026 год составит 600 млрд рублей. Ожидается, что эти средства принесут доход в размере 1,4 трлн рублей, несмотря на то, что генеративные модели на текущем этапе не окупаются из-за высокой стоимости разработки и обучения [!].

Такая масштабная инвестиционная программа становится ответом на двойной вызов: технологический и ресурсный. С одной стороны, требуется создание собственной вычислительной мощи, с другой — обеспечение её физическим «железом». Критическим узким местом становится не только доступ к графическим процессорам, но и наличие сырья для их производства. Например, дефицит специальной стеклоткани T-glass, необходимой для упаковки мощных ИИ-процессоров, уже привел к росту цен на материал на 20–30% и удвоению сроков поставки [!]. Производители чипов вынуждены заключать прямые договоры с поставщиками сырья, чтобы гарантировать объемы, так как баланс спроса и предложения не восстановится до середины 2027 года.

В этих условиях доступ к оборудованию перестает зависеть только от цены. Производители меняют правила игры, требуя предоплаты и заключения долгосрочных контрактов. Компании, готовые переходить на такие условия, получают приоритет в поставках дефицитных чипов, в то время как остальные сталкиваются с задержками или необходимостью искать альтернативы [!]. Для российского бизнеса это создает новый класс рисков: даже при наличии собственного кода и данных запуск проекта может быть отложен на месяцы из-за невозможности физически получить компоненты.

Данные как новый стратегический актив

Проблема суверенного ИИ не ограничивается «железом». Обучение качественной модели требует огромных массивов данных, отражающих национальную специфику. Использование исключительно англоязычных источников приводит к формированию западных культурных кодов, что делает систему менее эффективной для локального рынка. Однако процесс оцифровки архивов и библиотек, который рассматривается как решение, занимает много времени и не может мгновенно закрыть потребность в данных.

Здесь в игру вступает правовой механизм. В России готовится изменение законодательства, которое разрешит обучение нейросетей на защищенных авторским правом материалах без согласия правообладателей. Это решение направлено на устранение критического дефицита данных для отечественных разработчиков. Закон предусматривает, что доступ к исходному контенту будет закрыт для конечного пользователя, что позволяет использовать его для анализа, но запрещает публичное воспроизведение. При этом авторским правом на результат работы нейросети будет обладать пользователь, внесший творческий вклад [!].

Такой подход превращает существующие массивы информации, включая «темные данные», которые ранее считались пассивными активами, в активное топливо для обучения моделей. Компании перестают удалять информацию, сохраняя её бессрочно, что позволяет извлекать знания из неструктурированных массивов, составляющих до 90% корпоративных хранилищ [!]. Законодательное разрешение на использование чужого контента становится быстрым «инжектором» данных, необходимым для старта разработки, в то время как оцифровка архивов продолжает работать на долгосрочную перспективу.

Стоит учесть: Качество национального ИИ будет зависеть не только от скорости оцифровки культурного наследия, но и от эффективности использования существующих данных благодаря новым правовым нормам.

Альтернативные пути и стратегические компромиссы

В условиях глобального дефицита и сложностей с поставками западных чипов рынок ищет альтернативы. Появление решений от китайских производителей, таких как Huawei, предлагает компромисс между пиковой производительностью и скоростью развертывания. Компании могут получить готовую инфраструктуру за четыре–шесть месяцев, что на два месяца быстрее стандартных сроков, характерных для западных поставщиков в текущих условиях [!].

Это создает новую дилемму для бизнеса: ждать топовые чипы с неопределенными сроками поставки или запускать проекты быстрее на альтернативном оборудовании с несколько иными характеристиками. Для многих компаний, особенно в условиях жесткой конкуренции, скорость выхода на рынок становится более важным фактором, чем абсолютная вычислительная мощность. Это перестраивает глобальные цепочки поставок и открывает возможности для новых провайдеров, готовых обменивать производительность на оперативность.

Сравнение подходов показывает, что стратегия «с нуля» требует не только финансовых вложений, но и гибкости в выборе поставщиков и адаптации к меняющимся условиям рынка.

ПараметрИспользование открытых моделейСобственная разработка с нуля
Риск блокировкиВысокий (зависимость от лицензии)Низкий (контроль кода)
Затраты на инфраструктуруНизкие (использование готового)Высокие (требуются инвестиции в GPU)
Доступ к даннымОграничен авторским правомРасширен за счет новых законов [!]
Сроки запускаБыстрые, но зависят от поставокДолгие, требуют поиска альтернатив [!]
Культурная адаптацияНизкая (западные коды)Высокая (приоритет локальным данным)

Для компаний, планирующих внедрение подобных технологий, ключевым фактором становится оценка баланса между стоимостью разработки, рисками зависимости и доступностью физических ресурсов. Текущая динамика показывает, что отрасль движется в сторону создания собственных баз данных и инфраструктуры, что потребует времени и дополнительных инвестиций.

На фоне этого: Инвестиции в суверенный ИИ перестают быть вопросом технологического развития и становятся стратегической необходимостью для сохранения рыночной позиции в условиях ограниченного доступа к глобальным ресурсам и данных.

Дальнейшее развитие ситуации будет зависеть от темпов оцифровки национального наследия, способности отрасли обеспечить необходимый объем вычислительных ресурсов и эффективности использования новых правовых механизмов для работы с данными. Компании, которые смогут эффективно управлять этими ресурсами и находить компромиссы между скоростью и производительностью, получат конкурентное преимущество на рынке. Те, кто отложит этот переход, рискуют столкнуться с потерей актуальности своих решений в условиях меняющейся геополитической и технологической реальности.

Коротко о главном

Как решается проблема дефицита качественных российских данных?

Для устранения недостатка локального контента отрасль активно оцифровывает архивы, библиотеки и исторические документы, ранее существовавшие только в бумажном виде. Увеличение объема таких данных необходимо для того, чтобы нейросети формировали ответы через призму национальной идентичности, а не западных культурных кодов.

Какие последствия влечет за собой самостоятельное предобучение модели?

Реализация стратегии требует значительно большего количества графических процессоров (GPU) и существенного роста затрат на инфраструктуру по сравнению с использованием готовых решений. Эти инвестиции оправданы необходимостью сохранить полный контроль над технологическим этапом и обеспечить долгосрочную устойчивость системы без сбоев.

Почему полностью отказываться от англоязычных данных при обучении нельзя?

Исключение иностранного контента привело бы к снижению качества системы, так как основная часть мировой информации хранится на английском языке. Вместо отказа применяется стратегия тщательной фильтрации и взвешивания данных, где приоритет отдается российским текстам и реалиям.

Какие риски несет зависимость от внешних разработчиков?

Использование чужих моделей создает уязвимость, при которой доступ к исходному коду или новым версиям может быть прекращен в любой момент. Это может привести к потере функциональности и невозможности дальнейшего развития системы, что делает критическим фактором собственный контроль над процессом предобучения.

Как отсутствие российских данных влияет на генерацию контента?

Нейросети, обученные на смешанных массивах без должного веса локальных знаний, воспроизводят западные культурные образы, например, изображая Винни-Пуха в стиле Disney вместо советской мультипликации. Активное обогащение базы национальным контентом позволяет системе корректно интерпретировать специфические культурные коды.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Бизнес; Управление и стратегия; Цифровизация и технологии; Передовые технологии

Оценка значимости: 8 из 10

Событие оценивается как национальное по масштабу, затрагивающее ключевые сферы технологий, экономики и культуры с долгосрочными последствиями для формирования суверенного цифрового пространства. Стратегия полного контроля над предобучением ИИ направлена на преодоление системных рисков зависимости от внешних поставщиков и защиту национальной идентичности, что требует масштабных инвестиций и фундаментальных изменений в отрасли. Глубина последствий заключается в создании устойчивой технологической экосистемы, способной функционировать в условиях внешних ограничений, что делает этот процесс критически важным для будущего развития страны.

Материалы по теме

Приоритет ИИ в производстве памяти: рост цен на электронику до 2027 года

Прогноз сохранения дефицита памяти и роста цен до второй половины 2027 года служит фундаментом для тезиса о структурном дисбалансе рынка, обосновывая необходимость для российских компаний закладывать существенное удорожание в бюджеты или снижать характеристики техники.

Подробнее →
Сбербанк в 2026 году удвоит инвестиции в ИИ до 350 млрд рублей

Цифры инвестиционной программы Сбера (350 млрд рублей в 2026 году, 600 млрд за три года и ожидаемый доход 1,4 трлн) конкретизируют финансовую модель суверенного ИИ, демонстрируя масштаб вложений и подтверждая тезис о том, что генеративные модели пока не окупаются из-за высокой стоимости разработки.

Подробнее →
Монополия на T-glass: дефицит удорожает ИИ-чипы на 30%

Данные о дефиците стеклоткани T-glass, росте цен на 20–30% и удвоении сроков поставки иллюстрируют, что критическим узким местом становится не только доступ к чипам, но и сырье для их производства, вынуждая производителей заключать прямые договоры с поставщиками.

Подробнее →
Рост цен на память: предоплата становится пропуском к дефицитным чипам

Факт изменения правил игры, когда доступ к дефицитным чипам гарантируется предоплатой и долгосрочными контрактами, подкрепляет аргумент о возникновении нового класса рисков, при котором запуск проектов может быть отложен на месяцы из-за невозможности физически получить компоненты.

Подробнее →
Обучение ИИ на чужом контенте: ускорение развития за счет обхода прав

Упоминание расширения доступа к данным за счет новых законов в сравнительной таблице служит конкретным доказательством преимущества собственной разработки с нуля перед использованием открытых моделей, где доступ ограничен авторским правом.

Подробнее →
Темные данные превращаются в топливо для ИИ при доминировании жестких дисков

Статистика о том, что неструктурированные массивы составляют до 90% корпоративных хранилищ, усиливает тезис о трансформации пассивных «темных данных» в стратегический актив, который компании перестают удалять, сохраняя его бессрочно для извлечения знаний.

Подробнее →
Huawei обходит дефицит чипов Nvidia скоростью развертывания дата-центров за полгода

В таблице данные о сроках запуска проектов на альтернативном оборудовании подчеркивают компромисс между скоростью и производительностью, иллюстрируя, как стратегия «с нуля» требует гибкости в поиске поставщиков и адаптации к условиям дефицита.

Подробнее →