WD вводит шестой уровень ИИ-инфраструктуры: хранение данных становится основой экономики токенов
Компания WD утверждает, что без шестого уровня хранения данных вся экономика искусственного интеллекта перестает работать. Жесткие диски становятся фундаментом для масштабирования, превращая разовые вычисления в долгосрочный актив, который дешевле и надежнее сохранять, чем использовать дорогие быстрые накопители.
Компания WD утверждает, что текущая модель инфраструктуры искусственного интеллекта, представленная как «пятиуровневый пирог» (энергия, чипы, инфраструктура, модели, приложения), требует шестого критического уровня — хранения данных. Без него экономика ИИ не работает: вычислительные мощности генерируют интеллект, но именно жесткие диски (HDD) обеспечивают долговременное сохранение, накопление и повторное использование данных, превращая разовые вычисления в капитализируемый актив. В условиях перехода к «экономике токенов», где каждый сгенерированный фрагмент данных становится продуктом, HDD становятся фундаментом для масштабирования, так как они позволяют хранить огромные объемы информации дешевле и надежнее, чем быстрые, но дорогие твердотельные накопители.
Важный нюанс: Инфраструктура ИИ перестает определяться только скоростью вычислений; теперь ключевым фактором становится способность системы дешево и надолго хранить накопленный опыт.
Пересмотр архитектуры ИИ-инфраструктуры
Существующая концепция рассматривает ИИ как промышленную систему, где каждый слой имеет свою функцию. Энергия обеспечивает физическую базу, чипы преобразуют её в вычисления, а приложения монетизируют результат. Однако в этой цепочке отсутствует звено, отвечающее за сохранение контекста и артефактов. Без него система теряет способность учиться на прошлом опыте и накапливать знания.
- Физический взгляд (снизу вверх): Энергия питает чипы, которые работают в рамках инфраструктуры, создавая модели для приложений.
- Экономический взгляд (сверху вниз): Приложения генерируют доход, который финансирует все нижележащие слои.
- Отсутствующий слой: Хранение данных выступает репозиторием опыта, сохраняя данные, выходные результаты и контекст, позволяя интеллекту сохраняться и улучшаться со временем.
Стоит учесть: В модели «пятиуровневого пирога» хранение часто игнорируется, хотя именно оно превращает разовые вычисления в долгосрочный экономический актив.
Экономическая роль хранения данных
В новой парадигме «экономики токенов» сгенерированный токен — это не просто единица данных, а потенциальный продукт: код, отчет, изображение или цифровой двойник. Ценность токена начинается не в момент генерации, а в момент его сохранения и последующего использования. Хранение делает этот процесс устойчивым.
- Масштабирование: Данные для обучения ИИ часто неструктурированы, фрагментированы и быстро меняются.
- Необходимые функции хранения:
- Сохранение больших обучающих корпусов.
- Хранение контрольных точек моделей (checkpoints).
- Поддержка корпоративных рабочих процессов и агентов.
- Выполнение требований по управлению и сохранению данных.
- Архивация артефактов, созданных ИИ.
- Векторные базы данных: Появляется новый слой внутри хранения, где семантическое представление контента (векторы) отделяется от самого файла, позволяя ИИ быстрее извлекать и анализировать информацию без повторной обработки исходных объектов.
На фоне этого: Рост спроса на хранение смещается от простого архивирования к активному управлению контекстом, необходимым для работы сложных ИИ-систем.
Разделение ролей: SSD против HDD
Инфраструктура ИИ требует сочетания двух типов накопителей, выполняющих разные задачи. Быстрые технологии (память, NVMe, SSD) обеспечивают мгновенный отклик и низкую задержку для активных вычислений. Жесткие диски (HDD) решают задачу экономической эффективности при хранении огромных массивов данных, к которым обращаются редко.
- SSD и память: Используются для быстрого мышления ИИ, активного извлечения данных и работы с контрольными точками в реальном времени.
- HDD: Обеспечивают долговременное хранение накопленных данных, логов, синтетических данных и медиа-активов.
- Экономический баланс: Облачные провайдеры (например, AWS) выделяют HDD как самый дешевый вариант для данных, к которым обращаются редко. Это позволяет бизнесу хранить «всю историю» без разорительных затрат.
Важно: HDD не заменяют быстрые накопители, а дополняют их, создавая экономически масштабируемую основу для переобучения моделей на растущем массиве данных.
Сигнал для рынка и цепочек поставок
Глобальный тренд на увеличение объемов данных (переход к эре зеттабайт) меняет структуру спроса на оборудование. Рост ИИ-инфраструктуры теперь зависит не только от доступности видеокарт и энергии, но и от способности поставщиков предоставить достаточные объемы надежного и дешевого хранения. Это создает устойчивый спрос на HDD в сегменте дата-центров, даже на фоне развития технологий флеш-памяти.
- Влияние на цепочки поставок: Производителям оборудования необходимо учитывать баланс между быстрыми и медленными слоями хранения при проектировании дата-центров.
- Реакция рынка: Инвестиции в ИИ теперь включают затраты на создание «памяти» системы, что расширяет рынок для производителей жестких дисков.
- Для бизнеса: Эффективность ИИ-проектов будет зависеть от архитектуры хранения, способной удерживать контекст и масштабироваться экономически.
Важный нюанс: Будущее ИИ-инфраструктуры определяется не только тем, как быстро система считает, но и тем, насколько эффективно она может хранить и управлять растущим массивом данных.
Источник: blog.westerndigital.com