Декабрь 2025 | Обзор события | 4

Tencent представила ИИ-модель HY 2.0 с 406 млрд параметров и улучшенной логикой

Компания Tencent выпустила новую версию своей ИИ-модели Hunyuan 2.0, представленную в двух форматах — Think и Instruct — с улучшенными возможностями обработки длинных текстов и выполнения сложных задач. Модель демонстрирует высокую эффективность в математике, программировании и генерации структурированного контента, а также оптимизировала использование вычислительных ресурсов за счёт снижения объёма ненужной информации.

Содержание

Обзор

Как Tencent Hunyuan 2.0 меняет правила игры в ИИ
- Когда больше — не значит лучше
- Скрытые победители и проигравшие
- Российский контекст и будущее внедрения
- Что дальше

ИСХОДНЫЙ НАРРАТИВ

По данным Ithome, 5 декабря текущего года стало известно о выходе новой версии собственного ИИ-модели Tencent Hunyuan 2.0, которую разработала Тencent. Новая версия представлена в двух форматах: Tencent HY 2.0 Think и Tencent HY 2.0 Instruct, каждая из которых предназначена для разных сценариев использования.

Модель построена на архитектуре MoE (Mixture of Experts), что позволяет ей обрабатывать до 256K токенов. Общий объём параметров составляет 406 млрд, из которых 32 млрд активируются в момент вычисления. Такие параметры позволяют модели демонстрировать высокую эффективность и точность в задачах, связанных с текстовым творчеством, логикой и исполнением сложных команд.

В сравнении с предыдущей версией, HY 2.0 Think получила улучшенные данные для обучения и стратегию усиленного обучения. Это особенно заметно в задачах, связанных с математикой, наукой, программированием и выполнением команд. В тестах, включая IMO-AnswerBench, HMMT2025, Humanity's Last Exam (HLE) и ARC AGI, модель показала стабильное и высокое качество вывода.

Особое внимание было уделено улучшению способности следовать инструкциям и работать с длинными текстами. Для этого была внедрена стратегия важности выборки, что позволило синхронизировать этапы обучения и вывода. Также модель использует многообразные проверенные задачи и рейтинговые критерии, что повысило её стабильность и качество в многоходовых задачах.

В области программирования и работы с интеллектуальными агентами, модель HY 2.0 была обучена на больших объёмах проверенных данных, что позволило улучшить её способность к автоматизации сложных операций. В тестах SWE-bench Verified и Tau2-Bench, ориентированных на реальные задачи, модель показала значительный прогресс.

Эффективность работы модели также улучшена за счёт внедрения точной стратегии штрафа за длину, что позволило снизить объём ненужной информации и оптимизировать использование вычислительных ресурсов. По сравнению с другими моделями, HY 2.0 Think достигает аналогичных результатов, но при этом использует меньше токенов, что делает её высокой по интеллектуальной плотности.

Модель использует двухэтапную стратегию усиленного обучения — RLVR + RLHF, что улучшило её способность генерировать качественный и структурированный текст, особенно в задачах, связанных с созданием контента, разработкой интерфейсов и выполнением команд.

По информации, предоставленной Тencent, модель HY 2.0 продолжит развитие в таких направлениях, как программирование, работа с агентами, персонализация стиля и долговременная память. Разработчики также намерены открыть часть технологий и моделей для сообщества.

Сейчас модель уже интегрирована в такие приложения Тencent, как Yuanbao и ima, а также доступна через Tencent Cloud API.

Интересно: Каким образом внедрение новых ИИ-моделей вроде Tencent HY 2.0 повлияет на рынок корпоративных решений и потребительских сервисов, где качество вывода и эффективность использования ресурсов становятся критически важными?

Концептуальное изображение

АНАЛИТИЧЕСКИЙ РАЗБОР

Как Tencent Hunyuan 2.0 меняет правила игры в ИИ

Разработка Tencent Hunyuan 2.0 — это не только очередной шаг в улучшении искусственного интеллекта. Это стратегическое движение, которое может изменить баланс сил в корпоративном и потребительском секторах, где эффективность и точность становятся ключевыми. При этом, за кажущейся «умностью» модели скрываются глубокие архитектурные и экономические решения, которые заслуживают внимания.

Когда больше — не значит лучше

Модель Hunyuan 2.0 имеет 406 млрд параметров, но активирует только 32 млрд при каждом запросе. Это не только техническая деталь. Это ключ к пониманию, как Tencent управляет вычислительными ресурсами и масштабированием.

Механизм Mixture of Experts (MoE) позволяет модели быть гибкой: она не загружает всё сразу, а подключает только те компоненты, которые действительно нужны. Это снижает затраты на вычисления и позволяет сохранить высокую производительность даже при обработке сложных задач. Для крупных компаний, внедряющих ИИ в свои продукты, это означает снижение операционных издержек и увеличение масштабируемости.

Важный нюанс: Технология MoE делает возможным создание «умных» моделей, которые остаются экономически эффективными. Это не только оптимизация — это сдвиг в подходе к проектированию ИИ.

Новости о том, что NVIDIA представила сервер GB200 NVL72, который в тестах показал производительность в 10 раз выше предыдущего поколения Hopper HGX 200 при работе с моделями на архитектуре MoE, подтверждают рост интереса к этой технологии. Это усиливает позиции Tencent: её модель уже сегодня оптимизирована для работы с подобными системами, что даёт преимущество в интеграции и масштабировании [!].

Скрытые победители и проигравшие

Tencent объявляет о планах открыть часть технологий для сообщества. На первый взгляд, это демонстрация открытости и желания ускорить развитие экосистемы. Но в реальности это может быть стратегическим ходом: таким образом компания привлекает разработчиков, создает вокруг себя сообщество и, в конечном итоге, укрепляет свою позицию как лидера в ИИ.

Однако, открытие частично доступных моделей может создать проблемы для мелких разработчиков и стартапов, которые не обладают ресурсами для адаптации и расширения этих моделей. Они могут оказаться в ситуации, где их продукты становятся зависимыми от экосистемы Tencent, а не конкурентоспособными.

Важный нюанс: Открытость может быть маскировкой для усиления доминирования крупных игроков. Кто использует открытые технологии, тот становится частью экосистемы, а не её альтернативой.

В Китае, где большинство ведущих лабораторий перешло на открытые модели с открытыми весами, рост популярности решений Tencent, Alibaba и DeepSeek наблюдается и за рубежом. Это усиливает международный технологический диалог, но также создаёт асимметрию в доступе к ресурсам [!].

Российский контекст и будущее внедрения

Для российского бизнеса внедрение таких моделей может стать как возможностью, так и риском. С одной стороны, доступ к высококачественным ИИ-инструментам через облако Tencent (или его аналоги) позволяет ускорить цифровизацию. С другой — зависимость от внешней инфраструктуры, особенно при отсутствии локальной версии модели, может создать уязвимости в случае сбоев, ограничений доступа или атак.

Российские компании, особенно те, что работают с государственными данными или в критически важных отраслях, должны оценивать, где именно хранятся и обрабатываются данные, какие протоколы используются для передачи информации, и кто имеет к ней доступ. Это особенно важно, если модель работает через иностранные облака.

Важный нюанс: Даже если модель кажется удобной и мощной, её реальная ценность для бизнеса определяется не только функционалом, но и уровнем контроля над данными и инфраструктурой.

В условиях роста спроса на специалистов по машинному обучению в России, где соискателей в 2,8 раза больше, чем вакансий, внедрение готовых ИИ-решений, таких как Hunyuan 2.0, может снизить барьеры для компаний, не имеющих внутренних команд по разработке моделей. Это особенно актуально в свете запуска платформ, позволяющих сократить время запуска проектов до 20 минут [!] [!].

Что дальше

Tencent продолжит развитие модели в направлениях программирования, агентов, персонализации и долговременной памяти. Это указывает на стремление компании к созданию универсальной ИИ-платформы, способной справляться с широким спектром задач — от автоматизации до творческих функций.

Для других игроков на рынке, особенно тех, кто не имеет таких масштабных вычислительных ресурсов, это может стать вызовом. Они должны либо адаптироваться, либо искать нишевые решения, где гибкость и специализация компенсируют меньшую мощность.

Важный нюанс: Универсальность становится новой нормой, но не все могут ею воспользоваться. Тех, кто не успеет, ждёт либо зависимость, либо вытеснение.

Кроме того, рост спроса на компоненты, такие как оперативная память DRAM, может ограничить доступ к ресурсам компаний, внедряющих ИИ. Samsung и SK hynix ограничивают мощности, чтобы сохранить прибыльность, что может продлить дефицит и повысить стоимость внедрения [!].

В долгосрочной перспективе, как показывает опыт Tencent в киноиндустрии, ИИ начинает влиять на распределение ролей в процессе создания контента, снижая издержки и ускоряя производство. Это указывает на то, что модели вроде Hunyuan 2.0 могут стать не только инструментами, но и архитекторами новых форм взаимодействия с данными [!].

Важный нюанс: Успешное внедрение ИИ требует не только технологической зрелости, но и стратегического подхода к управлению ресурсами, кадрами и данными.

Источник: IT Home

Контакты Асектор ✉

Коротко о главном

Какие параметры имеет модель Tencent HY 2.0 и что это даёт?

Модель имеет 406 млрд параметров, из которых 32 млрд активируются при вычислениях, что позволяет ей обрабатывать до 256K токенов и эффективно справляться с задачами текстового творчества, логики и исполнения сложных команд.

Какие улучшения были внесены в HY 2.0 Think по сравнению с предыдущей версией?

Модель получила улучшенные данные для обучения и усиленную стратегию обучения, что повысило её эффективность в математике, науке, программировании и выполнении команд, особенно в тестах IMO-AnswerBench, HMMT2025 и других.

Как модель HY 2.0 улучшила работу с длинными текстами и инструкциями?

Была внедрена стратегия важности выборки и использованы проверенные задачи с рейтинговыми критериями, что повысило стабильность и качество вывода при работе с многоходовыми задачами.

Какие улучшения были сделаны в области программирования и автоматизации?

Модель обучалась на больших объёмах проверенных данных, что позволило улучшить её способность автоматизировать сложные операции, что подтверждено результатами тестов SWE-bench Verified и Tau2-Bench.

Как повысилась эффективность работы HY 2.0 Think?

Благодаря точной стратегии штрафа за длину модель снизила объём ненужной информации, оптимизировала использование ресурсов и достигла высокой интеллектуальной плотности при аналогичных результатах.

Какова стратегия обучения HY 2.0 и как она влияет на качество текста?

Модель использует двухэтапную стратегию RLVR + RLHF, что улучшило её способность генерировать качественный и структурированный текст, особенно при создании контента и выполнении команд.

Где уже применяется модель HY 2.0 и какие планы у Tencent?

Модель интегрирована в приложения Yuanbao и ima, а также доступна через Tencent Cloud API. Компания планирует развивать модель в направлениях программирования, агентов, персонализации и долговременной памяти, а также открыть часть технологий для сообщества.

Инфографика событий

Открыть инфографику на весь экран

Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Разработка ПО; Бизнес; Цифровизация и технологии; Передовые технологии

Темы: Искусственный интеллект; Машиное обучение;

Оценка значимости: 4 из 10

Событие связано с развитием ИИ-модели китайской компании Tencent, что делает его зарубежным. Оно затрагивает сферу технологий и имеет потенциал для влияния на рынок ИИ-решений, но прямого и значимого воздействия на российскую аудиторию пока нет. Масштаб аудитории ограничен регионом, время воздействия и сферы влияния пока не показывают глубоких или долгосрочных последствий для России.

Материалы по теме

NVIDIA создала AI-сервер, который превзошёл Hopper в 10 раз

Информация о сервере GB200 NVL72 от NVIDIA, показавшего в 10 раз большую производительность по сравнению с Hopper HGX 200 при работе с архитектурой MoE, используется для подтверждения роста интереса к этой технологии и демонстрации того, что Hunyuan 2.0 уже оптимизирована для её применения. Это усиливает аргумент о стратегическом преимуществе Tencent на рынке ИИ.

Подробнее →

Китайские ИИ-модели DeepSeek и Alibaba усиливают давление на западных конкурентов

Упоминание роста популярности китайских моделей искусственного интеллекта, таких как Tencent, Alibaba и DeepSeek, как в Китае, так и за его пределами, служит подтверждением тезиса о международном технологическом диалоге и асимметрии в доступе к ресурсам. Это укрепляет идею о доминировании крупных игроков в глобальной экосистеме ИИ.

Подробнее →

Samsung и SK hynix ограничивают мощности из-за бума спроса на память для ИИ

Сведения о дефиците оперативной памяти DRAM и стратегии ограничения мощностей у производителей, таких как Samsung и SK hynix, в условиях роста спроса на компоненты для ИИ, используются для иллюстрации возможных барьеров для внедрения ИИ-технологий. Это поддерживает аргумент о том, что даже при наличии мощных моделей доступ к ресурсам может стать ограничением.

Подробнее →

Рынок машинного обучения в России растет: соискателей в 2,8 раза больше, чем вакансий

Данные о росте числа соискателей по направлению машинного обучения в 2,8 раза быстрее, чем спрос на вакансии, используются для демонстрации дефицита специалистов в России. Это усиливает тезис о том, что внедрение готовых ИИ-решений, таких как Hunyuan 2.0, может снизить барьеры для компаний, не имеющих внутренних команд по разработке моделей.

Подробнее →

K2 Cloud и К2 НейроТех запустили платформу для быстрого старта с ИИ

Описание платформы от K2 Cloud и К2 НейроТех, позволяющей сократить время запуска ИИ-проектов до 20 минут, используется для подтверждения идеи снижения барьеров для внедрения ИИ в бизнес-процессы. Это поддерживает аргумент о том, что готовые решения могут компенсировать нехватку квалифицированных кадров.

Подробнее →

Tencent оценил, как ИИ меняет киноиндустрию и распределяет творческую власть

Анализ влияния искусственного интеллекта на киноиндустрию, включая снижение издержек и ускорение производственных процессов, используется для иллюстрации долгосрочной трансформации, которую ИИ может вызвать в различных отраслях. Это подкрепляет тезис о том, что модели вроде Hunyuan 2.0 становятся не просто инструментами, но и архитекторами новых форм взаимодействия с данными.

Подробнее →