Апрель 2026   |   Обзор события   | 4

Xiaomi открыла код агентов ИИ: снижение затрат на 40–60% против закрытых моделей

Открытый код моделей Xiaomi предлагает бизнесу способ резко снизить расходы на агентный ИИ за счет высокой эффективности использования токенов. Компании получают возможность самостоятельно развертывать мощные системы для длительных задач, избегая постоянных платежей за проприетарные API и получая полный контроль над данными.

ИСХОДНЫЙ НАРРАТИВ

По данным Computerworld, компания Xiaomi выпустила и открыла исходный код моделей MiMo-V2.5 и MiMo-V2.5-Pro под лицензией MIT. Это решение предоставляет разработчикам доступ к инструментам для создания агентов искусственного интеллекта, способных выполнять длительные задачи, такие как написание кода и автоматизация рабочих процессов, с потенциально меньшими затратами. Обе версии поддерживают контекстное окно в 1 миллион токенов, что позволяет обрабатывать объемные данные без потери контекста. Модель MiMo-V2.5-Pro ориентирована на сложные задачи программирования и работы агентов, тогда как MiMo-V2.5 представляет собой нативную омнимодальную систему, работающую с текстом, изображениями, видео и аудио.

Выход новых моделей совпадает с ростом нагрузки на корпоративные бюджеты из-за внедрения агентного ИИ. Такие системы потребляют значительное количество токенов при планировании действий, вызове инструментов, написании кода и исправлении ошибок, делая контроль расходов и развертывания критически важным фактором. Использование лицензии MIT позволяет компаниям свободно модифицировать, развертывать и коммерциализировать модель без необходимости получения дополнительных разрешений. Тулика Шил, старший вице-президент Kadence International, отмечает, что такая свобода действий встречается редко в современном ландшафте ИИ и делает решение привлекательным для бизнеса.

Экономическая эффективность и технические характеристики

Техническая архитектура моделей построена на принципе разреженного смешения экспертов (MoE), что позволяет оптимизировать вычислительные затраты. Версия MiMo-V2.5 содержит 310 миллиардов параметров, но активирует лишь 15 миллиардов на каждый запрос. Более мощная версия Pro насчитывает 1,02 триллиона параметров, при этом активация ограничивается 42 миллиардами. Гибридная система внимания в модели Pro способна сократить объем памяти кэша KV почти в семь раз при работе с длинными контекстами.

В ходе тестирования на бенчмарке ClawEval модель V2.5-Pro показала результат 64% Pass, используя примерно 70 тысяч токенов на траекторию. Это на 40–60% меньше, чем требуется аналогичным по возможностям моделям Claude Opus 4.6, Gemini 3.1 Pro и GPT-5.4. Xiaomi привела примеры длительных автономных задач: модель Pro создала компилятор SysY на языке Rust за 4,3 часа, совершив 672 вызова инструментов и успешно пройдя все 233 скрытых теста. В другом случае система за 11,5 часов автономной работы и 1868 вызовов инструментов сгенерировала десктопный видеоредактор объемом 8192 строки кода.

ХарактеристикаMiMo-V2.5MiMo-V2.5-Pro
Общее количество параметров310 млрд1,02 трлн
Активные параметры на запрос15 млрд42 млрд
Тип моделиОмнимодальная (текст, видео, аудио, изображения)Специализированная для агентов и кода
Контекстное окно1 млн токенов1 млн токенов
Оптимизация памятиСтандартнаяСнижение KV-кэша в 7 раз

Стратегия внедрения и оценка рисков

Внедрение моделей Xiaomi в корпоративную среду будет зависеть от оценки баланса между производительностью, стоимостью и рисками. Лян Цзе Су, главный аналитик Omdia, советует компаниям рассматривать совокупную стоимость владения (TCO), включающую эффективность использования токенов, стоимость успешного выполнения задачи и отсутствие лицензионных отчислений, характерных для проприетарных решений. Закрытые модели могут сохранять преимущество в решении типовых задач и сложных граничных случаев, тогда как модели с открытыми весами демонстрируют превосходство в высоконагруженных агентных операциях.

Парик Джайн, генеральный директор Pareekh Consulting, предлагает рассматривать MiMo-V2.5 не как замену флагманским моделям вроде Claude или GPT, а как экономически эффективное решение для задач с высоким потреблением токенов. Ключевым показателем здесь выступает не только точность, но и количество токенов на одну успешную задачу. Флагманские модели часто достигают более высоких показателей успеха в сложных тестах, но требуют значительных ресурсов на рассуждения. MiMo-V2.5 спроектирована для максимальной эффективности токенов, достигая сопоставимых результатов при значительно меньших затратах входных и выходных данных.

Ашиш Банерджи, старший главный аналитик Gartner, указывает, что подобные модели могут существенно изменить экономику корпоративного ИИ для агентов с длительным горизонтом планирования. При задачах, требующих миллионов токенов, тарифицируемые проприетарные API перестают быть удобным инструментом и начинают восприниматься как налог на итерации. Открытые веса, лицензия MIT, контекстное окно в 1 миллион токенов и относительно низкая стоимость делают развертывание в приватном облаке или на собственных серверах стратегически обоснованным шагом.

Однако это не означает полный отказ от проприетарных API. Предприятия, вероятно, продолжат использовать их для задач, требующих максимальной точности и минимального операционного потребления, перемещая масштабированные и повторяемые агентные рабочие процессы на открытые модели, где важнее предсказуемость затрат, контроль над данными и возможность кастомизации. Долгосрочный агентный ИИ с высоким объемом задач будет развиваться как гибридный рынок, где открытые модели, подобные MiMo, снижают зависимость исключительно от API.

При этом аналитики отмечают потенциальные сложности с принятием решений китайского происхождения в регулируемых западных организациях, где могут возникать вопросы безопасности и соответствия нормативным требованиям. Для бизнеса это означает необходимость тщательного анализа юрисдикции и политик использования данных перед внедрением. Ситуация требует детального рассмотрения того, как именно компании будут выстраивать гибридную архитектуру, сочетая закрытые и открытые решения для достижения оптимального баланса между качеством, стоимостью и контролем.

АНАЛИТИЧЕСКИЙ РАЗБОР

Экономика контроля: почему Xiaomi открывает код

Решение Xiaomi выпустить модели MiMo-V2.5 и MiMo-V2.5-Pro под свободной лицензией MIT выглядит как жест доброй воли, но за ним стоит четкая бизнес-логика. Сегмент искусственного интеллекта и электромобилей компании впервые вышел на прибыль, показав рост дохода на 199% в третьем квартале 2025 года [!]. Открытие исходного кода в этот момент — не благотворительность, а стратегический ход для закрепления рыночных позиций. Компания переводит фокус с продажи готовых устройств на создание экосистемы, где корпоративные клиенты становятся частью цепочки создания стоимости.

Лицензия MIT позволяет бизнесу модифицировать модель, развертывать её на собственных серверах и избегать регулярных платежей за использование API. Это меняет структуру затрат: расходы смещаются из операционных (OpEx) в капитальные (CapEx). Вместо аренды вычислительной мощности компания инвестирует в оборудование и команды DevOps. Такой переход оправдан, когда речь идет о задачах с длительным горизонтом планирования, где стоимость проприетарных решений становится непропорционально высокой из-за потребления миллионов токенов.

Архитектура эффективности и скрытые риски

Техническая основа моделей строится на архитектуре с разреженным смешением экспертов (MoE). В версии Pro из более чем триллиона параметров активируется лишь 42 миллиарда на каждый запрос. Это позволяет существенно снизить вычислительную нагрузку и стоимость обработки данных. Тесты показывают, что для выполнения сложных задач, таких как создание компилятора или видеоредактора, модель тратит на 40–60% меньше токенов, чем флагманские закрытые аналоги.

Однако экономия на токенах не гарантирует экономии на бизнес-процессах. Современные ИИ-агенты требуют полного доступа к цифровым активам для выполнения задач, что создает критические риски безопасности. Эксперты по кибербезопасности предупреждают, что автономные агенты могут действовать как «очень умные идиоты», способные случайно уничтожить данные или нарушить работу систем при выполнении простых операций [!]. Если модель экономит ресурсы, но допускает ошибку, последствия которой стоят миллионов, то дешевизна токена теряет смысл.

Для бизнеса это означает, что внедрение таких решений требует не просто установки софта, а построения жесткой системы контроля. Необходимо внедрять механизмы проверки действий агентов человеком (Human-in-the-loop) и ограничивать их права доступа. Без этого переход на открытые модели превращается в поиск уязвимостей, а не оптимизацию затрат.

Важный нюанс: Открытая лицензия снимает финансовый барьер входа, но перекладывает ответственность за безопасность и стабильность работы полностью на заказчика. Экономия на токенах может быть нивелирована стоимостью устранения последствий одной критической ошибки агента.

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

Геополитический контекст и стратегия данных

Внедрение китайских моделей в корпоративную среду происходит на фоне глобальной конкуренции за технологическое лидерство. Стратегия Китая по развитию открытых решений создает саморазвивающееся преимущество, которое трудно нейтрализовать экспортными ограничениями. Эти модели опираются на физический цикл накопления данных в производственной базе, превращая промышленные данные в ключевой актив [!].

Доступность таких решений вынуждает компании пересматривать стратегии закупок. Низкая стоимость и высокая производительность стимулируют массовое внедрение, особенно в стартапах и средних предприятиях. Однако скрытое проникновение моделей в цепочки поставок создает риски, связанные с юрисдикцией и безопасностью данных. Для регулируемых отраслей, таких как финансы или здравоохранение, это требует тщательного аудита происхождения моделей и спецификации компонентов.

Ситуация формирует гибридный рынок. Компании, вероятно, будут использовать закрытые API для задач, требующих максимальной точности и минимального риска, а масштабированные процессы с высоким потреблением ресурсов перенесут на локальные развертывания открытых моделей. Это позволяет снизить зависимость от внешних поставщиков и контролировать расходы, но усложняет архитектуру ИТ-инфраструктуры.

Стоит учесть: Выбор между открытой моделью и закрытым API становится стратегическим решением, определяющим степень зависимости компании от конкретных геополитических блоков и готовность брать на себя риски управления инфраструктурой.

Успех внедрения MiMo зависит от способности бизнеса адаптировать процессы под новую экономическую модель. Те, кто сможет эффективно управлять инфраструктурой и рисками, получат преимущество в скорости и стоимости разработки. Остальные рискуют столкнуться с непредсказуемыми затратами, пытаясь заменить проверенные решения более дешевыми, но менее контролируемыми аналогами.

Коротко о главном

Как архитектура MoE снижает вычислительные затраты в этих моделях?

Несмотря на наличие 1,02 триллиона параметров в версии Pro, на каждый запрос активируется лишь 42 миллиарда, что оптимизирует ресурсы благодаря принципу разреженного смешения экспертов.

Насколько меньше токенов потребляет MiMo-V2.5-Pro по сравнению с конкурентами?

Модель использует на 40–60% меньше токенов, чем Claude Opus 4.6, Gemini 3.1 Pro и GPT-5.4, при этом демонстрируя результат 64% Pass^3 на бенчмарке ClawEval.

Какие сложные автономные задачи выполнила модель Pro в ходе тестирования?

Система создала компилятор SysY на языке Rust за 4,3 часа и сгенерировала видеоредактор объемом 8192 строк кода за 11,5 часов, совершив сотни вызовов инструментов.

Какую проблему с памятью решает гибридная система внимания в версии Pro?

Данная технология сокращает объем кэша KV почти в семь раз при работе с длинными контекстами, что критично для обработки объемных данных без потери информации.

Почему аналитики рекомендуют использовать эти модели для задач с высоким потреблением токенов?

Эксперты считают их экономически эффективным решением для масштабных агентных операций, где тарифицируемые проприетарные API становятся слишком дорогими из-за объема итераций.

Какие риски возникают при внедрении решений китайского происхождения в западных компаниях?

Организации сталкиваются с необходимостью тщательного анализа безопасности и соответствия нормативным требованиям перед использованием моделей из-за вопросов юрисдикции.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Разработка ПО; Бизнес; Аналитика и исследования; Управление и стратегия; Цифровизация и технологии

Оценка значимости: 4 из 10

Событие представляет собой локальный для России технологический релиз китайской компании, который не оказывает прямого влияния на жизнь граждан или экономику страны, однако имеет среднесрочную перспективу для IT-сектора и разработчиков благодаря открытой лицензии и высокой эффективности моделей, что позволяет российским специалистам потенциально снижать затраты на внедрение агентного искусственного интеллекта, несмотря на отсутствие системных последствий для общества в целом.

Материалы по теме

Xiaomi выходит в прибыль: ИИ и электромобили ускоряют трансформацию

Факт выхода сегмента ИИ и электромобилей Xiaomi на прибыль с ростом дохода на 199% в третьем квартале 2025 года служит ключевым доказательством того, что открытие исходного кода моделей MiMo — это не благотворительность, а взвешенная бизнес-стратегия, направленная на закрепление рыночных позиций в момент финансовой стабильности.

Подробнее →
Агентный ИИ требует полного доступа: бизнес рискует потерять все данные из-за ошибок алгоритмов

Предупреждение экспертов о том, что автономные агенты могут вести себя как «очень умные идиоты» и случайно уничтожить данные, подкрепляет тезис о скрытых рисках внедрения открытых моделей. Этот факт демонстрирует, что экономия на токенах может быть нивелирована стоимостью критических ошибок, обосновывая необходимость внедрения жесткого контроля и механизма Human-in-the-loop.

Подробнее →
Китайские открытые модели ИИ: скрытая угроза безопасности и удешевление корпоративных решений

Утверждение о том, что стратегия Китая по развитию открытых решений опирается на физический цикл накопления данных в производственной базе, раскрывает геополитический подтекст успеха моделей MiMo. Эти данные объясняют, почему экспортные ограничения не могут нейтрализовать преимущество китайских разработок, превращая промышленные данные в неуязвимый актив и вынуждая компании пересматривать стратегии закупок.

Подробнее →