Обзор по теме: HBM4 и 2-нм чипы: снижение затрат на ИИ-инфраструктуру на 30% без потери мощности
Переход к 2-нм чипам и памяти HBM4 превращает энергоэффективность в главный драйвер рентабельности, позволяя масштабировать ИИ без взрывного роста затрат на электричество.
Новый фундамент для рентабельных вычислений
Мировая индустрия высокопроизводительных вычислений переживает фундаментальный сдвиг, связанный с переходом от экспериментальных образцов к массовому производству критически важных компонентов. В центре событий оказалась компания Micron, запустившая серийный выпуск памяти HBM4 и накопителей PCIe Gen6. Эти решения формируют техническую базу для архитектуры NVIDIA Vera Rubin, позволяя увеличить пропускную способность в 2,3 раза и вдвое повысить энергоэффективность. Для бизнеса это означает возможность масштабировать ИИ-инфраструктуру без пропорционального роста затрат на электроэнергию, что становится главным фактором рентабельности проектов.
Параллельно с развитием памяти происходит эволюция вычислительных ядер. TSMC начала серийное производство чипов по 2-нм техпроцессу, обеспечив рост производительности на 10–15% и снижение энергопотребления на 25–30%. Это позволяет одновременно выпускать компоненты для мобильных устройств и серверов, ускоряя поставку технологий на рынок. Финансовые результаты подтверждают тренд: в третьем квартале 2025 года выручка TSMC достигла рекордных $33,1 млрд, при этом сегмент высокопроизводительных вычислений обеспечил 57% всех продаж. Компоненты для ИИ и серверов стали основным драйвером роста, опередив традиционные направления.
Скорость как новая валюта
Производительность систем перестала измеряться только количеством транзисторов; теперь ключевым показателем стала скорость обработки запросов и минимизация задержек. NVIDIA представила архитектуру Blackwell Ultra, которая демонстрирует в 1,5 раза более высокую эффективность в задачах с низкой латентностью по сравнению с предшественником. Благодаря оптимизации методов разделения запросов и улучшению кэширования, пиковая пропускная способность достигла 226,2 токена в секунду на GPU. Такой скачок меняет подходы к построению агентных систем искусственного интеллекта, заставляя гиперскейлеров пересматривать стратегии выбора оборудования.
Конкуренция за технологическое лидерство стимулирует появление уникальных инфраструктурных решений. Компания xAI запустила суперкомпьютер Colossus 2 мощностью 1 гигаватт для тренировки модели Grok, с планом увеличения мощности до 1,5 гигаватта в ближайшие месяцы. В Норвегии в эксплуатацию введен суперкомпьютер Olivia, размещенный в подземном дата-центре. Он сочетает процессоры AMD и чипы NVIDIA Grace Hopper, снижая потребление энергии на 30% и используя отходящее тепло для нужд рыбоводных хозяйств. Эти примеры показывают, как оптимизация энергопотребления становится не просто экологической инициативой, а способом снижения операционных расходов.
Экосистема и новые горизонты
Развитие отрасли движется не только за счет аппаратного ускорения, но и через расширение программных возможностей и партнерств. NVIDIA представила модель Apollo для симуляции физических процессов, от прогнозирования погоды до моделирования термоядерного синтеза, позиционируя ИИ как инструмент, дополняющий, а не заменяющий традиционное моделирование. Стратегические альянсы также укрепляют позиции лидеров: NVIDIA приобрела пакет акций Intel на сумму $5 млрд для совместной разработки продуктов, включая интеграцию технологии NVLink. Это сотрудничество направлено на создание единой экосистемы для центров обработки данных, где x86-процессоры Intel будут работать в тандеме с ускорителями NVIDIA.
Рынок памяти продолжает расширяться, предлагая решения для различных сценариев использования. Samsung анонсировала SSD PCIe 6.0 с объемом до 512 ТБ и скоростью до 28 ГБ/с, ориентированные на дата-центры. SK hynix раскрыла дорожную карту развития памяти HBM до 2031 года, включая создание гибридной технологии HBF, сочетающей высокую пропускную способность и емкость. В России такие технологические прорывы открывают доступ к решениям, позволяющим ускорять обучение моделей и снижать задержки при обработке данных. Для руководителей и специалистов ключевым становится понимание того, что эффективность будущих проектов будет зависеть от своевременного внедрения этих новых стандартов памяти и вычислений.
🤖 Сводка сформирована нейросетью на основе фактов из Календаря. Мы обновляем аналитический дайджест при необходимости — факты и хронология всегда доступны в Календаре ниже для проверки и изучения.
📅 Последнее обновление сводки: 24 апреля 2026.