Май 2026 | Обзор события | 3

Western Digital: путаница памяти и хранилища снижает эффективность ИИ-инфраструктуры

Путаница между оперативной памятью и долговечным хранилищем превращается в скрытую угрозу для архитектуры центров обработки данных искусственного интеллекта. Ошибки в проектировании этих слоев ведут к простоям мощных видеокарт и резкому росту затрат, заставляя инженеров пересматривать подходы к доставке данных.

Содержание

Обзор

Разделение ролей: от волатильности к долговечности

Приоритеты архитектуры: скорость против надежности

Влияние на работу вычислительных мощностей

Экономика данных: почему путаница в архитектуре обходится в миллиарды
- Экономика скорости и цена надежности
- Жесткие диски как экономический фундамент
- Сигнал для рынка и стратегия масштабирования

ИСХОДНЫЙ НАРРАТИВ

По данным Western Digital (WD), в современной архитектуре центров обработки данных для искусственного интеллекта сохраняется фундаментальное заблуждение: память и хранилище данных часто рассматриваются как взаимозаменяемые ресурсы. Эта путаница, возникшая еще в эпоху первых персональных компьютеров, сегодня создает реальные риски для проектирования ИТ-инфраструктуры. Инвесторы и инженеры нередко объединяют акции производителей жестких дисков с компаниями, выпускающими память, не учитывая, что эти компоненты выполняют принципиально разные функции. Понимание разницы между летучей памятью и долговечным хранилищем становится критическим фактором для обеспечения эффективности работы искусственного интеллекта.

Разделение ролей: от волатильности к долговечности

Ключевое различие между двумя типами носителей кроется в их поведении при отключении питания. Память по своей природе является эфемерной: при потере электропитания все содержащиеся в ней данные исчезают безвозвратно. Это летучая среда, предназначенная для краткосрочной работы с информацией в режиме реального времени. В противоположность этому, хранилище обеспечивает долговечность. Данные на жестких дисках, ленточных накопителях или флеш-памяти сохраняются даже после выключения системы. Именно свойство нелетучести является обязательным условием для любого решения, претендующего на роль надежного хранилища.

В контексте центров обработки данных это разделение определяет физическую топологию сети. Эксперты предлагают простой критерий: ресурсы, расположенные на стороне вычислительных мощностей, функционируют как память или кэш, тогда как ресурсы за пределами локальной сети вычислений служат хранилищем. Хотя современные технологии, такие как NVMe-oF и архитектура GPUDirect, позволяют подключать устройства хранения через сетевые интерфейсы, их функциональное назначение остается неизменным. С одной стороны сети находятся вычислительные блоки, требующие мгновенного доступа к данным, с другой — массивы накопителей, гарантирующие сохранность информации.

Приоритеты архитектуры: скорость против надежности

Различие в назначении диктует совершенно разные подходы к проектированию систем. В слое хранилища главным приоритетом становится целостность и сохранность данных. Для этого применяются сложные механизмы защиты, включая географическую репликацию и коды исправления ошибок. Например, технология программно-определяемого хранилища (SDS) разбивает файлы на множество фрагментов и распределяет их по сотням или тысячам устройств. Если часть накопителей выйдет из строя, исходные данные могут быть восстановлены благодаря избыточности. Это обеспечивает практически полную защиту от потери информации, что критически важно для тренировочных наборов данных объемом в петабайты.

В слое памяти и кэширования приоритеты смещаются в сторону производительности. Поскольку данные уже надежно защищены в нижнем слое хранилища, здесь можно отказаться от избыточных механизмов защиты. Отказ от дублирования и сложных алгоритмов восстановления снижает задержки и увеличивает количество операций ввода-вывода в секунду. Архитекторы систем принимают решения, основываясь на требованиях к латентности и общему качеству обслуживания программного стека ИИ. В то время как слой хранилища оптимизируется под общую стоимость владения и устойчивость к сбоям, слой памяти настраивается для максимальной скорости обработки.

Влияние на работу вычислительных мощностей

Эффективность работы графических процессоров (GPU) напрямую зависит от того, насколько грамотно выстроена подача данных. Основной принцип работы ИИ-систем гласит: нельзя допускать простоя вычислительных ядер. В задачах обучения моделей критическим параметром становится пропускная способность. Буферная память на стороне вычислений заполняется данными заранее, чтобы обеспечить непрерывный поток информации для GPU, исключая простои из-за задержек в сети.

Ситуация меняется при выполнении задач инференса (вывода результатов). Здесь запросы пользователей носят случайный и непредсказуемый характер, что делает последовательную передачу данных неэффективной. В этом сценарии доминируют требования к низкой задержке и высокой скорости отдельных операций. Для таких задач идеально подходят оперативная память и флеш-накопители, работающие в режиме кэша. Хранилище в этот момент выступает в роли резервного источника, подгружая контекст пользователя при открытии новой сессии или в случае отсутствия данных в кэше.

Характеристика	Слой памяти и кэша	Слой хранилища
Главная цель	Максимальная производительность и низкая задержка	Долговечность и целостность данных
Реакция на сбой питания	Данные теряются (летучая память)	Данные сохраняются (нелетучая память)
Ключевой метрика	IOPS (операций ввода-вывода в секунду)	Пропускная способность и защита от потерь
Механизмы защиты	Минимальные или отсутствуют (данные дублируются в хранилище)	Коды исправления ошибок, репликация
Типичные устройства	DRAM, быстрые флеш-накопители	HDD, ленточные накопители, массивы SSD

Для инфраструктуры искусственного интеллекта понимание этих различий перестает быть технической деталью и становится основой для устойчивого масштабирования. Системы больше не ограничены только мощностью процессоров; их эффективность теперь определяется тем, насколько быстро и надежно данные могут быть доставлены в нужное место в нужный момент. Ошибки в проектировании, связанные с игнорированием специфики памяти и хранилища, могут привести к значительным потерям производительности и росту затрат.

Рынок оборудования для ИИ реагирует на эти вызовы, предлагая решения, которые четко разграничивают функции. Интеграция технологий, таких как Compute eXpress Link (CXL), позволяет гибко распределять ресурсы, но не отменяет необходимости в четкой логической разнице между временным буфером и постоянным архивом. Для российских компаний, развивающих собственные ИТ-решения и внедряющих технологии машинного обучения, этот сигнал рынка указывает на необходимость пересмотра подходов к закупке и конфигурации оборудования. Фокус смещается с простого накопления гигабайт на оптимизацию потоков данных между слоями памяти и хранилища.

Глобальный тренд на разделение ответственности между слоями инфраструктуры требует от специалистов глубокого анализа архитектуры своих систем. Только при условии точного понимания роли каждого компонента можно построить эффективную среду для работы нейросетей, способную выдерживать растущие нагрузки без потери данных и производительности. Детальное изучение этих механизмов становится обязательным этапом для любого проекта, претендующего на серьезное внедрение технологий искусственного интеллекта.

АНАЛИТИЧЕСКИЙ РАЗБОР

Экономика данных: почему путаница в архитектуре обходится в миллиарды

В современной инфраструктуре центров обработки данных для искусственного интеллекта закрепилась опасная иллюзия: память и хранилище данных часто воспринимаются как взаимозаменяемые ресурсы. Эта ошибка, укоренившаяся еще в эпоху первых персональных компьютеров, сегодня трансформируется из технической неточности в финансовый риск. Инвесторы и инженеры, объединяющие в одну категорию производителей жестких дисков и чипов оперативной памяти, игнорируют фундаментальные различия в физике работы этих компонентов. Для эффективного масштабирования систем ИИ критически важно понимать: память — это среда для мгновенной обработки, а хранилище — это стратегический запас сырья.

Разделение ролей определяется не маркетинговыми названиями, а поведением систем при отключении питания и их местом в цепочке создания ценности. Оперативная память (DRAM) хранит информацию только при наличии электричества. Это «рабочий стол» вычислительной системы, где данные находятся в режиме активной обработки. Хранилище (HDD, SSD, ленты) сохраняет информацию независимо от питания. Это «склад сырья», где лежат экзабайты данных, необходимые для обучения моделей. Смешение этих понятий ведет к тому, что системы либо замедляются из-за избыточной защиты данных в оперативной памяти, либо теряют информацию из-за недостаточной надежности в слоях, требующих долговечности.

Важный нюанс: Ошибка в классификации носителей ведет не к поломке оборудования, а к системному снижению эффективности: дорогие вычислительные мощности простаивают в ожидании данных, а критически важная информация рискует быть утерянной из-за отсутствия необходимых механизмов защиты.

Экономика скорости и цена надежности

Разделение функций диктует принципиально разные экономические модели. В слое хранилища приоритетом является целостность данных. Здесь работают сложные механизмы, такие как географическая репликация и коды исправления ошибок. Файлы разбиваются на фрагменты и распределяются по тысячам устройств. Если один диск выйдет из строя, данные восстановятся автоматически. Это гарантирует сохранность петабайтов тренировочных наборов, но создает задержки.

В слое памяти и кэширования логика меняется кардинально. Поскольку данные уже надежно защищены в нижнем слое, здесь можно отказаться от дублирования. Это позволяет достичь максимальной скорости. Архитекторы систем жертвуют избыточностью ради снижения задержек и увеличения количества операций ввода-вывода в секунду. Попытка применить механизмы защиты хранилища к оперативной памяти или, наоборот, использовать оперативную память как постоянное хранилище без должной защиты, нарушает баланс между стоимостью владения и производительностью.

Для графических процессоров (GPU), являющихся сердцем ИИ, критически важен непрерывный поток данных. Если буферная память на стороне вычислений не заполняется заранее, мощные ядра простаивают. В задачах обучения это недопустимо, так как пропускная способность определяет скорость обучения модели. В задачах инференса, где запросы случайны, доминирует низкая задержка. Здесь оперативная память и быстрые флеш-накопители работают как кэш, а хранилище выступает резервом.

Стоит учесть: Инвестиции в инфраструктуру ИИ перестают быть вопросом закупки. Теперь это вопрос точной настройки потоков данных, где неправильный выбор типа носителя для конкретной задачи может увеличить стоимость владения системой в разы без прироста производительности.

Концептуальное изображение

Жесткие диски как экономический фундамент

Существует устойчивое заблуждение, что жесткие диски (HDD) устарели и должны быть полностью заменены флеш-памятью. Однако данные показывают обратное: переход исключительно на SSD сделает масштабирование ИИ экономически невозможным. Разница в стоимости хранения между HDD и SSD составляет от 5 до 10 раз в расчете на терабайт. При прогнозируемом росте объемов данных до 527,5 зеттабайта к 2029 году, попытка заменить HDD на SSD приведет к взрывному росту капитальных затрат, сделав проекты нерентабельными [!].

Более того, современные жесткие диски перестали быть просто «медленным архивом». Благодаря технологиям ePMR и двойного актуатора, пропускная способность HDD выросла с 300 МБ/с до 1,2 ГБ/с, с теоретическим пределом в 4,8 ГБ/с [!]. Это позволяет механическим накопителям конкурировать с флеш-памятью в задачах обучения ИИ, где важна не только скорость, но и объем. 80% данных в масштабируемых облачных системах хранятся на классических 3,5-дюймовых накопителях, что делает их стабильность решающим фактором для работы ИИ [!].

Технологический прорыв позволил увеличить плотность записи до 32 ТБ в стандартном корпусе без роста габаритов оборудования [!]. Это дает бизнесу возможность масштабировать хранилища, сохраняя текущие капитальные и операционные расходы на инфраструктуру дата-центров. Жесткие диски превратились из массового товара в стратегический элемент инфраструктуры, сопоставимый по важности с процессорами и графическими ускорителями.

Сигнал для рынка и стратегия масштабирования

Глобальный рынок реагирует на эти вызовы изменением правил игры. Крупнейшие производители накопителей, включая Western Digital, Seagate и SanDisk, переходят от краткосрочных сделок к долгосрочным контрактам, фиксируя объемы поставок до 2029 года [!]. Это означает, что «окно возможностей» для спонтанных закупок закрыто. Свободных мощностей на открытом рынке практически нет, так как новые фабрики строятся исключительно под гарантированные многолетние обязательства.

Для российских компаний, развивающих собственные ИТ-решения, это создает специфический вызов. Отсутствие доступа к краткосрочным сделкам требует пересмотра подходов к планированию инфраструктуры. Фокус смещается с простого накопления объемов на оптимизацию взаимодействия между слоями памяти и хранилища. Игнорирование специфики носителей может привести к тому, что даже при наличии мощного оборудования система не сможет раскрыть свой потенциал. Эффективность определяется не только мощностью процессоров, но и тем, насколько быстро и надежно данные доставляются в нужное место.

Рынок оборудования предлагает решения, которые четко разграничивают функции. Технологии, такие как Compute eXpress Link (CXL), позволяют гибко распределять ресурсы, но не отменяют необходимости в логическом разделении временного буфера и постоянного архива. Стратегия масштабирования теперь строится на балансе между скоростью доступа и надежностью хранения, где каждый компонент выполняет свою уникальную роль в общей цепи создания искусственного интеллекта.

Важный нюанс: Архитектура ИИ — это не просто выбор между скоростью и надежностью, это жесткая экономическая модель, где HDD остаются безальтернативным фундаментом для масштабирования, а попытка заменить их памятью или флеш-накопителями делает проекты экономически нежизнеспособными.

Источник: blog.westerndigital.com

Контакты Асектор ✉

Коротко о главном

В чем заключается фундаментальное различие между памятью и хранилищем при отключении питания?

Память является летучей и безвозвратно теряет данные при потере электропитания, тогда как хранилище обеспечивает долговечность и сохраняет информацию даже после выключения системы.

Какой критерий определяет физическое расположение ресурсов в сети центров обработки данных?

Ресурсы на стороне вычислительных мощностей функционируют как память для мгновенного доступа, а устройства за пределами локальной сети служат хранилищем для гарантии сохранности данных.

Почему в слое хранилища применяются сложные механизмы защиты, такие как географическая репликация?

Эти меры необходимы для обеспечения целостности петабайтных тренировочных наборов данных и позволяют восстановить информацию при выходе из строя части накопителей благодаря избыточности.

Зачем в слое памяти отказываются от избыточных механизмов защиты?

Устранение дублирования и сложных алгоритмов восстановления снижает задержки и увеличивает количество операций ввода-вывода в секунду, что критично для производительности вычислений.

Как архитектура подачи данных влияет на эффективность работы графических процессоров (GPU)?

Для исключения простоев вычислительных ядер буферная память заполняется данными заранее, обеспечивая непрерывный поток информации и высокую пропускную способность во время обучения моделей.

Почему задачи инференса требуют иной конфигурации, чем обучение моделей?

Случайный характер пользовательских запросов делает последовательную передачу неэффективной, поэтому приоритет смещается к низкой задержке и использованию кэша для мгновенного доступа к данным.

Как технология Compute eXpress Link (CXL) влияет на распределение ресурсов?

Она позволяет гибко управлять ресурсами, но не отменяет необходимости четкого логического разделения между временным буфером и постоянным архивом для устойчивого масштабирования систем.

Инфографика событий

Открыть инфографику на весь экран

Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Бизнес; Аналитика и исследования; Тренды и кейсы; Цифровизация и технологии; Передовые технологии

Темы: Архитектура центров обработки данных; Оптимизация инфраструктуры для ИИ; Разделение памяти и хранилища;

Оценка значимости: 3 из 10

Событие представляет собой техническую рекомендацию по оптимизации архитектуры центров обработки данных, актуальную для узкого круга специалистов в сфере ИИ, но не имеющую прямого массового воздействия на население или экономику России в краткосрочной перспективе. Хотя тренд на разделение памяти и хранилища важен для долгосрочного развития отечественных ИТ-проектов, текущая информация носит скорее образовательный характер и не вызывает немедленных системных изменений или кризисов, ограничиваясь влиянием на профессиональное сообщество разработчиков и инженеров.

Материалы по теме

Жесткие диски: без них масштабирование ИИ становится экономически невозможным

Прогноз роста объемов данных до 527,5 зеттабайта к 2029 году и разница в стоимости хранения в 5–10 раз стали математическим обоснованием тезиса о том, что полный переход на SSD сделает проекты ИИ экономически нежизнеспособными. Эти цифры превратили абстрактное утверждение о важности жестких дисков в конкретный финансовый аргумент против замены HDD флеш-памятью.

Подробнее →

Жесткие диски захватывают задачи искусственного интеллекта за счет четырехкратного роста скорости

Данные о росте пропускной способности HDD с 300 МБ/с до 1,2 ГБ/с и теоретическом пределе в 4,8 ГБ/с разрушили миф о «медленном архиве», доказав способность механических накопителей конкурировать с флеш-памятью в задачах обучения ИИ. Этот факт позволил автору аргументировать, что современные диски являются активным элементом вычислительной цепочки, а не просто пассивным хранилищем.

Подробнее →

Жесткие диски стали стратегическим ресурсом для инвестиций в искусственный интеллект

Статистика о том, что 80% данных в масштабируемых облачных системах хранятся на 3,5-дюймовых накопителях, закрепила статус жестких дисков как стратегического элемента инфраструктуры. Этот показатель усилил вывод о том, что стабильность HDD стала решающим фактором для работы ИИ, сравняв их значимость с процессорами и графическими ускорителями.

Подробнее →

Жесткие диски на 32 ТБ без расширения стоек: снижение затрат на дата-центры

Факт увеличения плотности записи до 32 ТБ без расширения габаритов оборудования послужил доказательством возможности масштабирования хранилищ без роста капитальных и операционных расходов. Это позволило автору показать, как технологический прорыв сохраняет экономическую эффективность дата-центров в условиях взрывного роста данных.

Подробнее →

Производители накопителей фиксируют цены до 2029 года из-за бумов ИИ

Информация о переходе производителей (Western Digital, Seagate, SanDisk) на долгосрочные контракты до 2029 года и закрытии «окна возможностей» для спонтанных закупок сформировала картину нового рыночного ландшафта. Этот факт обосновал необходимость для российских компаний пересмотреть стратегии планирования инфраструктуры, сместив фокус на оптимизацию, а не просто накопление объемов.

Подробнее →