Архитектура ИИ-хранилищ: жесткие диски и SSD растут одновременно из-за инференса
Ожидания о полной замене жестких дисков твердотельными накопителями в эпоху ИИ не оправдались, так как рынок столкнулся с одновременным взрывным ростом спроса на обе технологии. Инференс генерирует бесконечные потоки данных, требующие сверхбыстрого доступа для работы и дешевого долговременного хранения для обучения будущих моделей.
По данным аналитиков Western Digital и отчетов ведущих технологических компаний, архитектура хранения данных для искусственного интеллекта претерпела фундаментальные изменения. Ожидания о том, что твердотельные накопители полностью вытеснят жесткие диски, не оправдались. Напротив, рынок демонстрирует одновременный рост спроса на оба типа носителей, вызванный спецификой работы нейросетей. Вычислительные мощности потребляют задачи, но данные накапливаются бесконечно. Каждый запрос к модели создает запись, которая не исчезает, а становится частью растущего массива информации. Это явление формирует новую структуру хранения, где твердотельные накопители и жесткие диски выполняют разные функции.
Разделение ролей в новой архитектуре
Традиционное представление о том, что хранение данных работает как вычислительная система, где задачи завершаются и ресурсы освобождаются, оказалось ошибочным в контексте ИИ. Данные не потребляются, а накапливаются. Процесс обучения моделей требует огромных объемов данных, но именно этап инференса (использования модели) создал совершенно новые требования к инфраструктуре.
В процессе обучения используется знакомая схема: небольшие рабочие наборы данных размещаются на быстрых носителях рядом с процессорами, а основная масса информации хранится на емких жестких дисках. Например, в суперкластере Meta⋆ на 6080 графических процессоров приходится 46 петабайт кэша на быстрых накопителях, при этом общий объем хранения исчисляется эксабайтами. Критические моменты, такие как сохранение контрольных точек модели, требуют мгновенной записи, что под силу только NVMe-накопителям, после чего данные переносятся на долговременное хранение.
Ситуация кардинально меняется на этапе инференса, который, по данным MIT Technology Review, потребляет от 80 до 90% всех вычислительных мощностей ИИ. Здесь сформировался новый, ранее не существовавший слой инфраструктуры. Он предназначен для хранения контекста диалогов (KV-кэша) и векторных баз данных. Один диалог длиной в 100 000 токенов генерирует около 100 ГБ контекстных данных. При миллионах одновременных сессий объем таких данных достигает сотен петабайт. Этот слой требует доступа за миллисекунды, что делает его естественной средой для высокоскоростных решений. Компании NVIDIA, WEKA и Pure Storage независимо друг от друга разработали платформы для этого уровня, подтверждая его архитектурную необходимость.
Поток записи как драйвер роста
Важнейшим фактором, определяющим судьбу жестких дисков, является не чтение данных, а их запись. Каждый запрос к нейросети генерирует выходные данные, которые необходимо сохранять. В масштабах гиперскейлеров эти записи превращаются в операционную историю, архивы для соблюдения нормативных требований и синтетические данные для будущих тренировок моделей.
Существует четыре основных потока данных, создаваемых в процессе работы ИИ:
- Сами ответы модели (текст, изображения, код), которые часто передаются пользователю и не требуют длительного хранения у провайдера.
- Состояние сессии и промежуточные вычисления, которые хранятся на быстрых носителях в период активности, а затем перемещаются на долговременное хранение.
- Данные для аудита и соблюдения регуляторных норм. Документация OpenAI указывает на хранение логов до 30 дней, в то время как Европейский акт об искусственном интеллекте требует сохранения информации о высокорисковых системах в течение 10 лет.
- Синтетические обучающие данные. Выходные данные текущих моделей становятся входными для обучения следующих поколений. Компания Meta⋆ подтвердила использование результатов работы своих моделей для улучшения более мелких версий в семействе Llama.
Два из четырех потоков данных сразу направляются на жесткие диски и остаются там годами. Еще один поток временно использует быстрые носители перед миграцией на жесткие диски. Только один поток в основном не задерживается в инфраструктуре провайдера. Это создает уникальный цикл: инференс генерирует данные, которые питают следующее обучение, создавая еще более совершенные модели, что, в свою очередь, увеличивает объем инференса и генерирует еще больше данных для хранения.
Структурные изменения рынка хранения
Традиционная облачная архитектура с двумя уровнями (быстрый кэш и массивное хранилище) трансформировалась в четырехуровневую систему. На вершине находятся сверхбыстрые накопители для весов моделей и переполнения памяти графических процессоров. Ниже располагается новый слой для KV-кэша, занимающий петабайты и работающий с эфемерными данными. Третий уровень отведен под векторные базы данных и встраивания, также требующие высокой скорости доступа. Самый нижний и самый объемный уровень — это массовое хранение на жестких дисках, куда попадают обучающие корпуса, контрольные точки, история сессий, архивы аудита и накапливающиеся синтетические данные.
Новые уровни на быстрых носителях не заменили массивное хранилище, а дополнили его. Объем данных на жестких дисках растет быстрее, чем прогнозировалось, именно из-за потока записи, генерируемого инференсом. Обучение увеличило потребность в объеме, а потребление моделей расширило слой быстрых накопителей. Однако именно выходные данные инференса снова ускорили рост нижнего уровня.
Рынок реагирует на эти изменения ростом цен и изменением структуры закупок. По прогнозам IDC, в 2025 году жесткие диски составят 82% продаваемой корпоративной емкости хранения. При этом стоимость корпоративных SSD в первом квартале 2026 года оказалась в 16 раз выше стоимости жестких дисков, согласно данным VDURA. Это разделение цен подчеркивает экономическую целесообразность использования разных технологий для разных задач.
Компании, планирующие масштабирование ИИ-решений в ближайшие годы, сталкиваются с необходимостью проектирования систем, способных экономически эффективно поддерживать постоянный рост данных. Успех будет зависеть не только от количества вычислительных мощностей, но и от архитектуры хранения, которая обеспечивает баланс между производительностью чтения и стоимостью долговременного хранения записей. Сигнал для рынка однозначен: ни одна технология не доминирует полностью, и эффективность системы зависит от правильного сочетания скоростных и емких решений. Детальный анализ этих процессов требует учета всех четырех уровней новой архитектуры и их взаимного влияния на операционные расходы.
Жесткие диски как стратегический актив: новая экономика хранения данных для ИИ
Рынок хранения данных переживает фундаментальный сдвиг, который меняет правила игры для всех участников. Представление о том, что твердотельные накопители (SSD) полностью вытеснят жесткие диски (HDD) в эпоху искусственного интеллекта, оказалось ошибочным. Реальность демонстрирует обратную картину: спрос на оба типа носителей растет, но их роли четко разграничены. Это не случайность, а следствие новой архитектуры, где данные не потребляются, а бесконечно накапливаются. Каждый запрос к нейросети создает запись, которая становится частью растущего массива информации, формируя структуру, требующую строгого разделения функций между скоростью и объемом.
Ключевым драйвером изменений стал этап инференса — процесса использования уже обученной модели. Именно здесь, согласно данным аналитиков, формируется до 90% нагрузки на вычислительные мощности. В отличие от этапа обучения, где данные загружаются и обрабатываются, инференс генерирует огромные объемы новых данных: контекст диалогов, логи сессий, синтетические материалы для будущего обучения. Один диалог длиной в 100 000 токенов может создать около 100 ГБ контекстных данных. При миллионах одновременных сессий эти объемы достигают сотен петабайт, требуя мгновенного доступа, но не вечного хранения на дорогих носителях.
Экономика бесконечного цикла и разделение ролей
Традиционная модель, где данные считались ресурсом, который исчезает после обработки, перестала работать. В экосистеме ИИ данные ведут себя как актив, который постоянно приумножается. Выходные данные текущих моделей становятся входными для обучения следующих поколений, создавая замкнутый круг саморазвития. Компания Meta⋆ уже подтвердила использование результатов работы своих моделей для улучшения более мелких версий в семействе Llama. Это означает, что каждый пользовательский запрос косвенно участвует в создании более совершенной системы, генерируя поток записи, который необходимо где-то хранить.
Здесь проявляется критическая экономическая дилемма. Сверхбыстрые NVMe-накопители необходимы для хранения «весов» модели и кэша контекста (KV-кэш), который должен быть доступен за миллисекунды. Однако хранить десятилетия логов аудита, истории сессий и терабайты синтетических данных на таких носителях экономически нецелесообразно. Стоимость корпоративных SSD в первом квартале 2026 года оказалась в 16 раз выше стоимости жестких дисков. В условиях, когда цены на чипы памяти NAND и модули DRAM выросли на 170% из-за дефицита, попытка использовать SSD для долговременного хранения превращается в финансовое самоубийство для любого проекта [!].
Жесткие диски возвращаются в центр внимания не как устаревшая технология, а как единственный экономически оправданный выбор для архивации истории ИИ. Они становятся фундаментом, на котором строится многоуровневая архитектура. Без HDD поток данных, генерируемый инференсом, просто некуда будет девать. Компании, игнорирующие этот аспект, рискуют столкнуться с экспоненциальным ростом операционных расходов, так как их инфраструктура не сможет масштабироваться без взрывного увеличения бюджета на хранение.
Важный нюанс: В условиях роста цен на энергию и дефицита мощностей, жесткие диски выигрывают не только по цене за терабайт, но и по энергоэффективности, становясь критическим элементом для снижения совокупной стоимости владения дата-центрами.

Архитектурные риски и энергетический фактор
Сложность новой архитектуры заключается не только в выборе носителей, но и в правильном распределении ролей между памятью и хранилищем. Western Digital предупреждает, что путаница между оперативной памятью и долговечным хранилищем становится скрытой угрозой для эффективности ИИ-инфраструктуры. Ошибки в проектировании, когда эти слои ошибочно рассматриваются как взаимозаменяемые, ведут к простоям мощных видеокарт и резкому росту затрат [!]. Слой хранилища требует приоритета целостности данных и механизмов защиты, тогда как слой памяти должен быть оптимизирован исключительно для производительности и низкой задержки. Неправильное распределение ролей способно вызвать простой вычислительных ядер GPU, сводя на нет инвестиции в дорогостоящее оборудование.
Энергетический фактор усиливает важность правильного выбора архитектуры. Инвестиции в ИИ смещаются от разработки алгоритмов к созданию физической инфраструктуры, где ключевым ресурсом становится доступ к электроэнергии. Goldman Sachs прогнозирует рост спроса на электричество от дата-центров на 175% к 2030 году [!]. В условиях дефицита энергомощностей и роста цен на электричество, жесткие диски демонстрируют преимущество перед SSD по показателю энергопотребления на терабайт. Это делает их не просто дешевым хранилищем, а стратегическим активом для обеспечения устойчивости дата-центров.
Технологическая эволюция HDD также подтверждает их актуальность. Производители, такие как Western Digital, представили диски емкостью до 32 ТБ без увеличения габаритов оборудования, что позволяет масштабировать хранилища без расширения площадей и нагрузки на системы охлаждения [!]. Разрабатываются модели High-Bandwidth HDD с удвоенной пропускной способностью, которые могут конкурировать с QLC-SSD в специфических сценариях хранения «теплых» данных [!]. Эти инновации позволяют HDD оставаться релевантными в условиях роста объемов данных, особенно в таких сферах, как хранение логов и контрольных точек для ИИ.
Доступ к оборудованию и долгосрочное планирование
Рынок реагирует на эти изменения изменением структуры закупок и логистики. Крупнейшие производители накопителей, включая Western Digital и Seagate, полностью загрузили свои мощности до 2026–2029 годов, отказавшись от краткосрочных сделок в пользу пятилетних контрактов [!]. Около 89% выручки Western Digital приходится на корпоративных клиентов, в то время как розничный сегмент получает лишь 5% поставок [!]. Это означает, что для бизнеса «просто купить диск» уже невозможно. Доступ к оборудованию гарантируется не низкой ценой, а готовностью заключать долгосрочные соглашения и формировать стратегические запасы заранее.
Для российского бизнеса эта ситуация создает уникальные вызовы и возможности. В условиях санкций и ухода западных вендоров, компании сталкиваются не с выбором между HDD и SSD, а с проблемой физического доступа к оборудованию. Стратегия гибридного хранения становится единственной возможностью выживания: использовать ограниченные запасы дорогих SSD только для критического инференса, а основной массив данных вынужденно и стратегически переносить на HDD. Это единственный сегмент, где еще можно найти объемы через альтернативные каналы поставок, и который не требует эксклюзивных контрактов с гигантами, фиксирующими цены на годы вперед.
Регуляторные требования также играют свою роль. Российское законодательство, включая требования к хранению логов и локализации данных, делает использование HDD не просто экономически выгодным, но и юридически обязательным для многих проектов. Хранение информации о высокорисковых системах в течение длительного времени на дорогих твердотельных накопителях противоречит принципам экономической эффективности, особенно в условиях роста издержек.
Стоит учесть: Эффективность ИИ-системы в будущем будет зависеть не от количества графических процессоров, а от способности архитектуры хранения балансировать между скоростью доступа к контексту и стоимостью архивации истории в условиях энергетических и логистических ограничений.
В конечном счете, архитектура хранения данных для ИИ перестала быть технической деталью. Она стала фундаментом, на котором строится экономика искусственного интеллекта. Успех зависит от того, насколько точно компании смогут распределить роли между скоростью и объемом, превратив бесконечный поток данных в управляемый актив. Жесткие диски трансформируются из «медленного архива» в критический элемент национальной ИИ-инфраструктуры, обеспечивающий физическую возможность масштабирования моделей там, где SSD и энергоресурсы становятся узким горлышком. Сигнал для рынка однозначен: ни одна технология не доминирует полностью, и эффективность системы зависит от правильного сочетания скоростных и емких решений.
Источник: blog.westerndigital.com