Сентябрь 2025 | Обзор события | 6

Tensordyne разработала энергоэффективную альтернативу чипам NVIDIA для ИИ

Компания Tensordyne разработала метод вычислений в искусственном интеллекте, основанный на логарифмических числах, позволяющий заменить умножение на сложение и снизить энергопотребление. Технология демонстрирует потенциал в повышении энергоэффективности чипов и улучшении производительности при работе с моделями ИИ.

Содержание

Обзор

Технические преимущества и сложности

Потенциал и реализация

Поддержка разработчиков и перспективы

Энергоэффективность как новый фактор конкуренции в ИИ
- Перезагрузка вычислений: от умножения к сложению
- Баланс между эффективностью и точностью
- Поддержка экосистемы и будущее внедрения

ИСХОДНЫЙ НАРРАТИВ

По данным аналитических публикаций, компания Recogni, недавно переименованная в Tensordyne, заявила о разработке нового метода представления чисел для вычислений в искусственном интеллекте. Новая система, основанная на логарифмических числах (LNS), позволяет заменить операции умножения на сложение, что снижает энергопотребление и аппаратные затраты. Это особенно важно для вычислений, связанных с матричными операциями, лежащими в основе современных моделей ИИ.

Технические преимущества и сложности

Метод Tensordyne использует логарифмическое представление вместо традиционных форматов с плавающей точкой. Это позволяет выполнять большинство операций с использованием сложения, что требует меньше ресурсов. В результате, по заявлению компании, чипы Tensordyne могут обеспечивать в 8 раз более высокую энергоэффективность по сравнению с решениями NVIDIA, такими как GB200 NVL72. При этом, по оценкам, мощность, потребляемая чипами, может составлять лишь 5% от энергии, необходимой для операций умножения в формате FP16.

Однако у метода есть ограничения. Основная сложность заключается в выполнении операций сложения в логарифмической системе, что требует корректирующих вычислений и может снижать эффективность. Чтобы решить эту проблему, Tensordyne разработала собственную схему приближения, которая, по её словам, позволяет сохранить точность вычислений при минимальных затратах.

Потенциал и реализация

Разработчики обещают, что их решение не только снижает энергопотребление, но и улучшает производительность. По данным Tensordyne, чипы способны генерировать до 3 миллионов токенов в секунду при работе с моделью Llama3 70B, что в несколько раз превосходит аналоги. Также компания демонстрирует улучшения в генерации видео: образцы, созданные с использованием LNS, показали меньшее количество артефактов и более стабильное качество.

В планах Tensordyne — выпуск серверного оборудования, включающего 144 процессора, 256 МБ SRAM и 144 ГБ HBM3e. Платформа будет поддерживать масштабирование до 144 GPU для параллельных вычислений. Технические детали, такие как тактовая частота и количество ядер, пока не раскрыты.

Поддержка разработчиков и перспективы

Для интеграции технологии Tensordyne предоставляет SDK, совместимый с популярными фреймворками, такими как Torch и Triton. Разработчики могут использовать промежуточное представление в Python, что делает платформу более доступной. По словам представителей компании, переход моделей на LNS требует минимальных усилий и не предполагает дополнительной калибровки или обучения.

Первые чипы, по словам CEO компании, будут готовы к производству в ближайшее время, а запуск продукта намечен на середину следующего года. Однако пока все заявленные параметры основаны на симуляциях, и их подтверждение будет зависеть от независимых тестов.

Рост интереса к энергоэффективным решениям в области ИИ отражает растущие требования к масштабируемости и экономичности вычислений. Решения, такие как LNS от Tensordyne, могут стать важным элементом инфраструктуры будущего, особенно в условиях ограниченности энергетических ресурсов.

АНАЛИТИЧЕСКИЙ РАЗБОР

Энергоэффективность как новый фактор конкуренции в ИИ

Перезагрузка вычислений: от умножения к сложению

Компания Tensordyne (ранее Recogni) предлагает инновационный подход к арифметике, лежащей в основе вычислений искусственного интеллекта. Вместо традиционного представления чисел с плавающей точкой (FP16, FP32) используется логарифмическая система (LNS), где операции умножения заменяются сложением. Это снижает энергопотребление и позволяет сократить аппаратные затраты. Такой подход может стать ключевым элементом в построении более экономичных и масштабируемых систем ИИ.

Система LNS особенно выгодна при выполнении матричных операций, что составляет основу современных моделей машинного обучения. По оценкам компании, её чипы могут быть в 8 раз более энергоэффективными, чем решения NVIDIA. Это открывает возможности для применения в облачных центрах обработки данных, где энергопотребление становится важным ограничением.

Ключевая идея: Переход от традиционных форматов вычислений к логарифмическим позволяет существенно снизить энергетические затраты, что делает ИИ-инфраструктуру более устойчивой и экономичной.

В контексте глобальных тенденций, стоит отметить, что NVIDIA продолжает расширять свою роль в сфере ИИ. Компания вложила $100 млрд в проект OpenAI для создания инфраструктуры мощностью 10 гигаватт, включающей около 4–5 млн графических процессоров. Это вдвое превышает годовой объем поставок NVIDIA в 2024 году. Также США рассматривают законопроект, ограничивающий экспорт мощных чипов, включая модели H100 и B300, что может повлиять на глобальную стратегию расширения NVIDIA.

Баланс между эффективностью и точностью

Однако переход на LNS не лишен вызовов. Операции сложения в логарифмической системе требуют дополнительных корректирующих вычислений, что может снижать общую эффективность. Чтобы минимизировать потери, Tensordyne разработала собственную схему приближения, позволяющую сохранять высокую точность вычислений при низких затратах. Такой подход демонстрирует стремление компании не только к инновациям, но и к их практической реализации.

Важно отметить, что компания не ограничивается теоретическими разработками. Уже сейчас Tensordyne демонстрирует практические результаты: её чипы показывают высокую производительность при генерации текста и видео. Это указывает на потенциал технологии для широкого применения в реальных сценариях.

Главный вывод: Успешная реализация LNS требует баланса между вычислительной эффективностью и точностью, что становится важным фактором при оценке готовности технологии к массовому применению.

Поддержка экосистемы и будущее внедрения

Для упрощения интеграции Tensordyne предоставляет SDK, совместимый с популярными фреймворками, такими как Torch и Triton. Это снижает барьер входа для разработчиков и ускоряет адаптацию новой технологии. Пользователям не требуется дополнительная калибровка или обучение моделей, что упрощает переход на LNS.

В планах компании — выпуск серверного оборудования с поддержкой масштабирования до 144 GPU. Это открывает возможности для создания мощных вычислительных кластеров, способных справляться с большими объёмами данных. Первые чипы появятся в ближайшее время, а полноценный запуск продукта намечен на середину следующего года.

Что это значит для бизнеса: Поддержка экосистемы и масштабируемость решения позволяют рассматривать LNS как перспективную платформу для будущих ИИ-приложений, особенно в условиях ограниченных ресурсов.

Важно также учитывать, что NVIDIA остаётся ключевым игроком в сфере ИИ-робототехники. Например, компания Figure, оценённая в $39 млрд, привлекла $1 млрд инвестиций, включая вклад NVIDIA. Средства направляются на развитие GPU-инфраструктуры для AI-платформы Helix, что подчеркивает роль NVIDIA в ускорении обработки данных и обучения моделей.

В условиях роста зависимости от NVIDIA, многие страны заключают с ней партнёрства для развития собственной ИИ-инфраструктуры. Однако это не исключает рисков долгосрочной зависимости от её чипов и архитектуры. Таким образом, поиск альтернативных решений, таких как LNS, становится важным элементом стратегии цифровой независимости.

Контакты Асектор ✉

Коротко о главном

Чипы Tensordyne обеспечивают в 8 раз более высокую энергоэффективность, чем у NVIDIA

По заявлению компании, чипы требуют лишь 5% энергии, необходимой для операций умножения в формате FP16, что делает их привлекательными для вычислений в ИИ.

Чипы способны генерировать до 3 миллионов токенов в секунду

При работе с моделью Llama3 70B производительность Tensordyne значительно превосходит аналоги, а качество генерации видео показывает меньшее количество артефактов и стабильность.

Платформа включает 144 процессора и 144 ГБ HBM3e

Серверное оборудование Tensordyne будет поддерживать масштабирование до 144 GPU для параллельных вычислений, но технические детали, такие как тактовая частота, пока не раскрыты.

SDK Tensordyne совместим с Torch и Triton

Разработчики могут использовать промежуточное представление в Python, что упрощает интеграцию, а переход моделей на LNS требует минимальных усилий и не включает дополнительное обучение.

Первые чипы будут готовы к производству в ближайшее время

Запуск продукта намечен на середину следующего года, однако все заявленные параметры пока основаны на симуляциях и требуют подтверждения независимыми тестами.

Инфографика событий

Открыть инфографику на весь экран

Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Кибербезопасность; Бизнес; Цифровизация и технологии; Передовые технологии; Энергетика

Темы: Инфраструктура искусственного интеллекта; Логарифмическое представление данных; Энергоэффективные вычисления;

Оценка значимости: 6 из 10

Событие относится к зарубежным разработкам в области искусственного интеллекта, что ограничивает его прямое влияние на российскую аудиторию. Однако технологии, связанные с энергоэффективностью вычислений, могут быть интересны в контексте развития отечественных ИИ-инфраструктур. Масштаб аудитории региональный, так как затрагивает специализированную техническую общественность. Воздействие среднесрочное, затрагивает несколько сфер — технологии и экономику. Последствия умеренные, так как речь идёт о потенциальной оптимизации, а не о системных изменениях.