Суверенный ИИ: отказ от готовых моделей ради независимости и роста затрат на GPU
Стратегия создания суверенного ИИ в России требует отказа от готовых решений в пользу разработки моделей с нуля, что гарантирует независимость от внешних ограничений. «Сбер» инвестирует в собственные вычислительные мощности и оцифровку национальных данных, чтобы обеспечить долгосрочную устойчивость бизнеса и точное отражение культурных реалий.
По данным РБК, стратегия создания суверенного искусственного интеллекта в России строится на полном контроле над этапом предобучения моделей. Антон Фролов, руководитель блока «Развитие генеративного ИИ» в Сбере, утверждает, что только собственный путь разработки гарантирует качество решения и защиту от внешних рисков, включая внезапное ограничение доступа к технологиям. Компания отказалась от использования готовых открытых архитектур в пользу создания модели с нуля, что требует значительных вычислительных мощностей, но обеспечивает независимость фундаментальных знаний системы.
Подход «Сбера» предполагает, что попытка модифицировать чужие open-source модели несет угрозу разрушения базовой логики нейросети при адаптации. Зависимость от внешних разработчиков создает уязвимость: доступ к исходному коду или новым версиям может быть прекращен в любой момент. Собственный контроль над процессом претрейна (предобучения) становится важным фактором для построения устойчивой экосистемы, способной работать в долгосрочной перспективе без сбоев.
Баланс данных и культурный контекст
Разработка национальной модели не означает полного отказа от глобального контента. Эксперты отмечают, что отказ от использования англоязычных данных при обучении привел бы к снижению качества системы, так как основная часть мировой информации хранится на английском языке. Стратегия заключается не в исключении иностранного контента, а в его тщательной фильтрации, очистке и взвешивании. Приоритет отдается российским текстам, культурным реалиям и локальным знаниям, чтобы система формировала ответы через призму национальной идентичности.
Существует объективная проблема дефицита качественных российских данных. Нейросети, обученные на смешанных массивах, могут выдавать результаты, основанные на западных культурных кодах. Например, при запросе на генерацию изображения Винни-Пуха система может воспроизвести образ героя Disney, а не персонажа советской мультипликации. Решение этой задачи лежит в плоскости активного оцифровывания архивов, библиотек и исторических документов, которые десятилетиями существовали только в бумажном виде.
Отрасль и научное сообщество уже работают над расширением российского массива данных. Антон Фролов подчеркивает, что для развития любых нейросетей объем доступной информации всегда будет недостаточным. Увеличение количества инициатив по обогащению данных напрямую влияет на качество конечного продукта. Суверенность в данном контексте рассматривается как инструмент усиления национальной идентичности и понимания специфических культурных кодов.
Экономические и технологические последствия
Выбор пути самостоятельного обучения модели с нуля влечет за собой существенное увеличение затрат на инфраструктуру. Для реализации стратегии требуется значительно больше GPU (графических процессоров), чем при использовании готовых решений. Эти инвестиции оправданы необходимостью сохранить контроль над ключевым технологическим этапом и избежать зависимости от внешних поставщиков.
Рынок сталкивается с вызовом нехватки специализированных вычислительных ресурсов, однако альтернативой в виде использования чужих моделей является риск потери функциональности и доступа. Бизнес-логика «Сбера» строится на том, что высокая стоимость входа компенсируется долгосрочной устойчивостью и отсутствием рисков блокировки.
| Параметр | Использование открытых моделей | Собственная разработка с нуля |
|---|---|---|
| Зависимость | Высокая (риск закрытия доступа) | Низкая (полный контроль) |
| Ресурсоемкость | Относительно низкая | Высокая (требуется много GPU) |
| Качество знаний | Риск искажения при адаптации | Сохранение фундаментальной логики |
| Культурный код | Ориентация на западные данные | Приоритет российским реалиям |
Ситуация требует постоянного мониторинга доступности данных и вычислительных мощностей. Для компаний, планирующих внедрение подобных технологий, ключевым фактором становится оценка баланса между стоимостью разработки и рисками зависимости от иностранных решений. Текущая динамика показывает, что отрасль движется в сторону создания собственных баз данных и инфраструктуры, что потребует времени и дополнительных инвестиций.
Дальнейшее развитие ситуации будет зависеть от темпов оцифровки национального наследия и способности отрасли обеспечить необходимый объем вычислительных ресурсов. Детальный анализ экономических моделей и технологических дорожных карт поможет понять, как именно изменится ландшафт рынка ИИ в ближайшие годы.
Цена суверенитета: от кода к физическим ресурсам
Стратегия создания суверенного искусственного интеллекта в России эволюционирует. Если ранее фокус смещался на отказ от чужих архитектур ради независимости кода, то сейчас на первый план выходит борьба за физические ресурсы и данные. Подход, реализуемый крупными игроками, такими как Сбер, предполагает полный контроль над этапом предобучения моделей. Это решение диктуется не только желанием избежать блокировок доступа к технологиям, но и необходимостью гарантировать качество фундаментальных знаний системы, которые невозможно корректно адаптировать, просто модифицируя чужие нейросети. Попытка изменить базовую логику готовой модели несет риск нарушения её внутренней целостности, что делает путь разработки с нуля единственным вариантом для построения устойчивой экосистемы.
Однако реализация этой стратегии сталкивается с новыми, более жесткими ограничениями. Глобальный рынок полупроводников переживает структурный дисбаланс, вызванный бумом спроса на инфраструктуру ИИ. Производители памяти перенаправляют мощности на выпуск высокопроизводительных компонентов, что создает дефицит стандартной памяти и ведет к росту цен, который, по прогнозам, сохранится до второй половины 2027 года [!]. Для российских компаний, зависящих от импорта, это означает необходимость закладывать существенный рост издержек в бюджеты или снижать характеристики выпускаемой техники.
Важный нюанс: Суверенитет в сфере ИИ сегодня определяется не только наличием собственного алгоритма, но и способностью обеспечить физический доступ к дефицитным компонентам в условиях глобального дисбаланса спроса и предложения.

Экономика высоких ставок и физический дефицит
Финансовая модель суверенного ИИ перестает быть абстрактной и обретает конкретные цифры. Сбербанк планирует удвоить инвестиции в развитие искусственного интеллекта до 350 млрд рублей в 2026 году. Общий объем вложений за период с 2024 по 2026 год составит 600 млрд рублей. Ожидается, что эти средства принесут доход в размере 1,4 трлн рублей, несмотря на то, что генеративные модели на текущем этапе не окупаются из-за высокой стоимости разработки и обучения [!].
Такая масштабная инвестиционная программа становится ответом на двойной вызов: технологический и ресурсный. С одной стороны, требуется создание собственной вычислительной мощи, с другой — обеспечение её физическим «железом». Критическим узким местом становится не только доступ к графическим процессорам, но и наличие сырья для их производства. Например, дефицит специальной стеклоткани T-glass, необходимой для упаковки мощных ИИ-процессоров, уже привел к росту цен на материал на 20–30% и удвоению сроков поставки [!]. Производители чипов вынуждены заключать прямые договоры с поставщиками сырья, чтобы гарантировать объемы, так как баланс спроса и предложения не восстановится до середины 2027 года.
В этих условиях доступ к оборудованию перестает зависеть только от цены. Производители меняют правила игры, требуя предоплаты и заключения долгосрочных контрактов. Компании, готовые переходить на такие условия, получают приоритет в поставках дефицитных чипов, в то время как остальные сталкиваются с задержками или необходимостью искать альтернативы [!]. Для российского бизнеса это создает новый класс рисков: даже при наличии собственного кода и данных запуск проекта может быть отложен на месяцы из-за невозможности физически получить компоненты.
Данные как новый стратегический актив
Проблема суверенного ИИ не ограничивается «железом». Обучение качественной модели требует огромных массивов данных, отражающих национальную специфику. Использование исключительно англоязычных источников приводит к формированию западных культурных кодов, что делает систему менее эффективной для локального рынка. Однако процесс оцифровки архивов и библиотек, который рассматривается как решение, занимает много времени и не может мгновенно закрыть потребность в данных.
Здесь в игру вступает правовой механизм. В России готовится изменение законодательства, которое разрешит обучение нейросетей на защищенных авторским правом материалах без согласия правообладателей. Это решение направлено на устранение критического дефицита данных для отечественных разработчиков. Закон предусматривает, что доступ к исходному контенту будет закрыт для конечного пользователя, что позволяет использовать его для анализа, но запрещает публичное воспроизведение. При этом авторским правом на результат работы нейросети будет обладать пользователь, внесший творческий вклад [!].
Такой подход превращает существующие массивы информации, включая «темные данные», которые ранее считались пассивными активами, в активное топливо для обучения моделей. Компании перестают удалять информацию, сохраняя её бессрочно, что позволяет извлекать знания из неструктурированных массивов, составляющих до 90% корпоративных хранилищ [!]. Законодательное разрешение на использование чужого контента становится быстрым «инжектором» данных, необходимым для старта разработки, в то время как оцифровка архивов продолжает работать на долгосрочную перспективу.
Стоит учесть: Качество национального ИИ будет зависеть не только от скорости оцифровки культурного наследия, но и от эффективности использования существующих данных благодаря новым правовым нормам.
Альтернативные пути и стратегические компромиссы
В условиях глобального дефицита и сложностей с поставками западных чипов рынок ищет альтернативы. Появление решений от китайских производителей, таких как Huawei, предлагает компромисс между пиковой производительностью и скоростью развертывания. Компании могут получить готовую инфраструктуру за четыре–шесть месяцев, что на два месяца быстрее стандартных сроков, характерных для западных поставщиков в текущих условиях [!].
Это создает новую дилемму для бизнеса: ждать топовые чипы с неопределенными сроками поставки или запускать проекты быстрее на альтернативном оборудовании с несколько иными характеристиками. Для многих компаний, особенно в условиях жесткой конкуренции, скорость выхода на рынок становится более важным фактором, чем абсолютная вычислительная мощность. Это перестраивает глобальные цепочки поставок и открывает возможности для новых провайдеров, готовых обменивать производительность на оперативность.
Сравнение подходов показывает, что стратегия «с нуля» требует не только финансовых вложений, но и гибкости в выборе поставщиков и адаптации к меняющимся условиям рынка.
| Параметр | Использование открытых моделей | Собственная разработка с нуля |
|---|---|---|
| Риск блокировки | Высокий (зависимость от лицензии) | Низкий (контроль кода) |
| Затраты на инфраструктуру | Низкие (использование готового) | Высокие (требуются инвестиции в GPU) |
| Доступ к данным | Ограничен авторским правом | Расширен за счет новых законов [!] |
| Сроки запуска | Быстрые, но зависят от поставок | Долгие, требуют поиска альтернатив [!] |
| Культурная адаптация | Низкая (западные коды) | Высокая (приоритет локальным данным) |
Для компаний, планирующих внедрение подобных технологий, ключевым фактором становится оценка баланса между стоимостью разработки, рисками зависимости и доступностью физических ресурсов. Текущая динамика показывает, что отрасль движется в сторону создания собственных баз данных и инфраструктуры, что потребует времени и дополнительных инвестиций.
На фоне этого: Инвестиции в суверенный ИИ перестают быть вопросом технологического развития и становятся стратегической необходимостью для сохранения рыночной позиции в условиях ограниченного доступа к глобальным ресурсам и данных.
Дальнейшее развитие ситуации будет зависеть от темпов оцифровки национального наследия, способности отрасли обеспечить необходимый объем вычислительных ресурсов и эффективности использования новых правовых механизмов для работы с данными. Компании, которые смогут эффективно управлять этими ресурсами и находить компромиссы между скоростью и производительностью, получат конкурентное преимущество на рынке. Те, кто отложит этот переход, рискуют столкнуться с потерей актуальности своих решений в условиях меняющейся геополитической и технологической реальности.
Источник: РБК