Xiaomi открыла код агентов ИИ: снижение затрат на 40–60% против закрытых моделей
Открытый код моделей Xiaomi предлагает бизнесу способ резко снизить расходы на агентный ИИ за счет высокой эффективности использования токенов. Компании получают возможность самостоятельно развертывать мощные системы для длительных задач, избегая постоянных платежей за проприетарные API и получая полный контроль над данными.
По данным Computerworld, компания Xiaomi выпустила и открыла исходный код моделей MiMo-V2.5 и MiMo-V2.5-Pro под лицензией MIT. Это решение предоставляет разработчикам доступ к инструментам для создания агентов искусственного интеллекта, способных выполнять длительные задачи, такие как написание кода и автоматизация рабочих процессов, с потенциально меньшими затратами. Обе версии поддерживают контекстное окно в 1 миллион токенов, что позволяет обрабатывать объемные данные без потери контекста. Модель MiMo-V2.5-Pro ориентирована на сложные задачи программирования и работы агентов, тогда как MiMo-V2.5 представляет собой нативную омнимодальную систему, работающую с текстом, изображениями, видео и аудио.
Выход новых моделей совпадает с ростом нагрузки на корпоративные бюджеты из-за внедрения агентного ИИ. Такие системы потребляют значительное количество токенов при планировании действий, вызове инструментов, написании кода и исправлении ошибок, делая контроль расходов и развертывания критически важным фактором. Использование лицензии MIT позволяет компаниям свободно модифицировать, развертывать и коммерциализировать модель без необходимости получения дополнительных разрешений. Тулика Шил, старший вице-президент Kadence International, отмечает, что такая свобода действий встречается редко в современном ландшафте ИИ и делает решение привлекательным для бизнеса.
Экономическая эффективность и технические характеристики
Техническая архитектура моделей построена на принципе разреженного смешения экспертов (MoE), что позволяет оптимизировать вычислительные затраты. Версия MiMo-V2.5 содержит 310 миллиардов параметров, но активирует лишь 15 миллиардов на каждый запрос. Более мощная версия Pro насчитывает 1,02 триллиона параметров, при этом активация ограничивается 42 миллиардами. Гибридная система внимания в модели Pro способна сократить объем памяти кэша KV почти в семь раз при работе с длинными контекстами.
В ходе тестирования на бенчмарке ClawEval модель V2.5-Pro показала результат 64% Pass, используя примерно 70 тысяч токенов на траекторию. Это на 40–60% меньше, чем требуется аналогичным по возможностям моделям Claude Opus 4.6, Gemini 3.1 Pro и GPT-5.4. Xiaomi привела примеры длительных автономных задач: модель Pro создала компилятор SysY на языке Rust за 4,3 часа, совершив 672 вызова инструментов и успешно пройдя все 233 скрытых теста. В другом случае система за 11,5 часов автономной работы и 1868 вызовов инструментов сгенерировала десктопный видеоредактор объемом 8192 строки кода.
| Характеристика | MiMo-V2.5 | MiMo-V2.5-Pro |
|---|---|---|
| Общее количество параметров | 310 млрд | 1,02 трлн |
| Активные параметры на запрос | 15 млрд | 42 млрд |
| Тип модели | Омнимодальная (текст, видео, аудио, изображения) | Специализированная для агентов и кода |
| Контекстное окно | 1 млн токенов | 1 млн токенов |
| Оптимизация памяти | Стандартная | Снижение KV-кэша в 7 раз |
Стратегия внедрения и оценка рисков
Внедрение моделей Xiaomi в корпоративную среду будет зависеть от оценки баланса между производительностью, стоимостью и рисками. Лян Цзе Су, главный аналитик Omdia, советует компаниям рассматривать совокупную стоимость владения (TCO), включающую эффективность использования токенов, стоимость успешного выполнения задачи и отсутствие лицензионных отчислений, характерных для проприетарных решений. Закрытые модели могут сохранять преимущество в решении типовых задач и сложных граничных случаев, тогда как модели с открытыми весами демонстрируют превосходство в высоконагруженных агентных операциях.
Парик Джайн, генеральный директор Pareekh Consulting, предлагает рассматривать MiMo-V2.5 не как замену флагманским моделям вроде Claude или GPT, а как экономически эффективное решение для задач с высоким потреблением токенов. Ключевым показателем здесь выступает не только точность, но и количество токенов на одну успешную задачу. Флагманские модели часто достигают более высоких показателей успеха в сложных тестах, но требуют значительных ресурсов на рассуждения. MiMo-V2.5 спроектирована для максимальной эффективности токенов, достигая сопоставимых результатов при значительно меньших затратах входных и выходных данных.
Ашиш Банерджи, старший главный аналитик Gartner, указывает, что подобные модели могут существенно изменить экономику корпоративного ИИ для агентов с длительным горизонтом планирования. При задачах, требующих миллионов токенов, тарифицируемые проприетарные API перестают быть удобным инструментом и начинают восприниматься как налог на итерации. Открытые веса, лицензия MIT, контекстное окно в 1 миллион токенов и относительно низкая стоимость делают развертывание в приватном облаке или на собственных серверах стратегически обоснованным шагом.
Однако это не означает полный отказ от проприетарных API. Предприятия, вероятно, продолжат использовать их для задач, требующих максимальной точности и минимального операционного потребления, перемещая масштабированные и повторяемые агентные рабочие процессы на открытые модели, где важнее предсказуемость затрат, контроль над данными и возможность кастомизации. Долгосрочный агентный ИИ с высоким объемом задач будет развиваться как гибридный рынок, где открытые модели, подобные MiMo, снижают зависимость исключительно от API.
При этом аналитики отмечают потенциальные сложности с принятием решений китайского происхождения в регулируемых западных организациях, где могут возникать вопросы безопасности и соответствия нормативным требованиям. Для бизнеса это означает необходимость тщательного анализа юрисдикции и политик использования данных перед внедрением. Ситуация требует детального рассмотрения того, как именно компании будут выстраивать гибридную архитектуру, сочетая закрытые и открытые решения для достижения оптимального баланса между качеством, стоимостью и контролем.
Экономика контроля: почему Xiaomi открывает код
Решение Xiaomi выпустить модели MiMo-V2.5 и MiMo-V2.5-Pro под свободной лицензией MIT выглядит как жест доброй воли, но за ним стоит четкая бизнес-логика. Сегмент искусственного интеллекта и электромобилей компании впервые вышел на прибыль, показав рост дохода на 199% в третьем квартале 2025 года [!]. Открытие исходного кода в этот момент — не благотворительность, а стратегический ход для закрепления рыночных позиций. Компания переводит фокус с продажи готовых устройств на создание экосистемы, где корпоративные клиенты становятся частью цепочки создания стоимости.
Лицензия MIT позволяет бизнесу модифицировать модель, развертывать её на собственных серверах и избегать регулярных платежей за использование API. Это меняет структуру затрат: расходы смещаются из операционных (OpEx) в капитальные (CapEx). Вместо аренды вычислительной мощности компания инвестирует в оборудование и команды DevOps. Такой переход оправдан, когда речь идет о задачах с длительным горизонтом планирования, где стоимость проприетарных решений становится непропорционально высокой из-за потребления миллионов токенов.
Архитектура эффективности и скрытые риски
Техническая основа моделей строится на архитектуре с разреженным смешением экспертов (MoE). В версии Pro из более чем триллиона параметров активируется лишь 42 миллиарда на каждый запрос. Это позволяет существенно снизить вычислительную нагрузку и стоимость обработки данных. Тесты показывают, что для выполнения сложных задач, таких как создание компилятора или видеоредактора, модель тратит на 40–60% меньше токенов, чем флагманские закрытые аналоги.
Однако экономия на токенах не гарантирует экономии на бизнес-процессах. Современные ИИ-агенты требуют полного доступа к цифровым активам для выполнения задач, что создает критические риски безопасности. Эксперты по кибербезопасности предупреждают, что автономные агенты могут действовать как «очень умные идиоты», способные случайно уничтожить данные или нарушить работу систем при выполнении простых операций [!]. Если модель экономит ресурсы, но допускает ошибку, последствия которой стоят миллионов, то дешевизна токена теряет смысл.
Для бизнеса это означает, что внедрение таких решений требует не просто установки софта, а построения жесткой системы контроля. Необходимо внедрять механизмы проверки действий агентов человеком (Human-in-the-loop) и ограничивать их права доступа. Без этого переход на открытые модели превращается в поиск уязвимостей, а не оптимизацию затрат.
Важный нюанс: Открытая лицензия снимает финансовый барьер входа, но перекладывает ответственность за безопасность и стабильность работы полностью на заказчика. Экономия на токенах может быть нивелирована стоимостью устранения последствий одной критической ошибки агента.

Геополитический контекст и стратегия данных
Внедрение китайских моделей в корпоративную среду происходит на фоне глобальной конкуренции за технологическое лидерство. Стратегия Китая по развитию открытых решений создает саморазвивающееся преимущество, которое трудно нейтрализовать экспортными ограничениями. Эти модели опираются на физический цикл накопления данных в производственной базе, превращая промышленные данные в ключевой актив [!].
Доступность таких решений вынуждает компании пересматривать стратегии закупок. Низкая стоимость и высокая производительность стимулируют массовое внедрение, особенно в стартапах и средних предприятиях. Однако скрытое проникновение моделей в цепочки поставок создает риски, связанные с юрисдикцией и безопасностью данных. Для регулируемых отраслей, таких как финансы или здравоохранение, это требует тщательного аудита происхождения моделей и спецификации компонентов.
Ситуация формирует гибридный рынок. Компании, вероятно, будут использовать закрытые API для задач, требующих максимальной точности и минимального риска, а масштабированные процессы с высоким потреблением ресурсов перенесут на локальные развертывания открытых моделей. Это позволяет снизить зависимость от внешних поставщиков и контролировать расходы, но усложняет архитектуру ИТ-инфраструктуры.
Стоит учесть: Выбор между открытой моделью и закрытым API становится стратегическим решением, определяющим степень зависимости компании от конкретных геополитических блоков и готовность брать на себя риски управления инфраструктурой.
Успех внедрения MiMo зависит от способности бизнеса адаптировать процессы под новую экономическую модель. Те, кто сможет эффективно управлять инфраструктурой и рисками, получат преимущество в скорости и стоимости разработки. Остальные рискуют столкнуться с непредсказуемыми затратами, пытаясь заменить проверенные решения более дешевыми, но менее контролируемыми аналогами.
Источник: computerworld.com