Март 2026   |   Обзор события   | 3

Темные данные превращаются в топливо для ИИ при доминировании жестких дисков

Компании перестают удалять информацию, превращая огромные объемы «темных данных» в ценное сырье для обучения искусственного интеллекта. Для снижения издержек и повышения точности моделей бизнесу стоит ориентироваться на жесткие диски (HDD) как на экономически эффективную основу многоуровневой архитектуры хранения.

ИСХОДНЫЙ НАРРАТИВ

По данным WD, предприятия переходят от стратегии экономии на архивировании к модели сохранения всей информации неограниченный срок. Причиной сдвига стал рост стоимости удаления данных из-за регуляторных требований и потенциальной ценности для искусственного интеллекта. Темные данные, ранее считавшиеся пассивным активом, теперь становятся сырьем для обучения моделей машинного обучения и повышения точности генеративных систем.

Ситуация изменилась: компании больше не спрашивают, какие данные они могут позволить себе хранить, а оценивают риски от их удаления. Объем темных данных в корпоративных хранилищах варьируется от 50% до 90% всей информации. Это создает колоссальный резерв для извлечения бизнес-инсайтов, если решить задачу по эффективной экстракции знаний. Исследования показывают, что ключевым инструментом трансформации пассивных массивов в активные ресурсы выступает искусственный интеллект.

Экономическая эффективность и выбор носителей

Архитектура современных дата-центров строится на балансе между производительностью и совокупной стоимостью владения (TCO). Жесткие диски (HDD) занимают доминирующее положение, обеспечивая 80% установленной емкости мировых центров обработки данных. Это объясняется способностью HDD сочетать высокую скорость извлечения информации с низкой стоимостью хранения по сравнению с альтернативами.

Для задач машинного обучения и подготовки данных к обучению моделей HDD остаются оптимальным решением. В отличие от флеш-памяти, стоимость которой при масштабировании может быть в шесть раз выше, жесткие диски предлагают экономически выгодную платформу для больших объемов информации. Сравнительные характеристики технологий хранения представлены ниже:

Параметр сравненияЖесткие диски (HDD)Флеш-память (Flash)
Доля рынка~80% емкости дата-центровОстаток вместе с лентой
Стоимость масштабированияНизкаяВысокая (в 6+ раз дороже HDD)
Оптимальная нагрузкаПропускная способность, объемные данныеВысокий IOPS, критичные по времени задачи
Роль в ИИХранение обучающих выборок, RAG-базыКэширование, активные вычисления

Эксперты отмечают, что производительность нельзя оценивать линейно. Если флеш-накопители работают как спринтеры, обеспечивая мгновенный отклик, то HDD выступают в роли марафонцев, гарантируя стабильную работу с большими объемами данных при минимальных затратах.

Стратегия для бизнеса в эпоху ИИ

Внедрение генеративного ИИ требует пересмотра подходов к управлению данными. Системы RAG (Retrieval-Augmented Generation) используют внутренние базы знаний для повышения точности ответов моделей, что делает доступ к темным данным критически важным. Предприятия могут использовать свои проприетарные массивы для дообучения больших языковых моделей (LLM), создавая уникальные инструменты под специфику своего бизнеса.

Главным фактором успеха становится способность инфраструктуры обрабатывать разнородные данные, ранее находившиеся в изолированных хранилищах или неструктурированном виде. Машинное обучение берет на себя задачу категоризации и анализа этих массивов, превращая их из «мертвого груза» в источник конкурентных преимуществ.

Для минимизации рисков и оптимизации затрат руководителям рекомендуется оценивать свои хранилища через призму многоуровневой архитектуры. Сохранение данных на HDD обеспечивает экономическую базу, а использование технологий развязки (disaggregated storage) гарантирует гибкость при изменении требований бизнеса. Такой подход позволяет извлекать ценность из накопленных лет информации без чрезмерного роста операционных расходов.

АНАЛИТИЧЕСКИЙ РАЗБОР

Новая экономика хранения: стратегия выживания в эпоху дефицита

Сдвиг в корпоративном секторе выходит за рамки технической оптимизации. Компании отказываются от стратегии экономии на архивировании в пользу модели вечного хранения, но причина кроется не только в регуляторных требованиях. Ключевой фактор — изменение баланса рисков: стоимость удаления данных стала выше их сохранения из-за потенциальной ценности для искусственного интеллекта и жестких нормативных штрафов за утерю контекста. Темные данные, ранее считавшиеся пассивным активом, теперь рассматриваются как стратегическое сырье. Объем этих массивов составляет от 50% до 90% всей корпоративной информации, что создает колоссальный резерв для обучения моделей, если решить задачу их эффективной экстракции.

Рынок столкнулся с новой реальностью: компании больше не спрашивают, какие данные они могут позволить себе хранить, а оценивают риски от их удаления. Исследования показывают, что ключевым инструментом трансформации пассивных массивов в активные ресурсы выступает искусственный интеллект. Однако доступ к этим данным усложняется макроэкономическими факторами, которые меняют саму логику выбора носителей.

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

Экономика хранения в условиях дефицита

Архитектура современных дата-центров вынуждена искать баланс между производительностью и совокупной стоимостью владения (TCO). Жесткие диски (HDD) сохраняют доминирующее положение, обеспечивая 80% установленной емкости мировых центров обработки данных. Однако тезис о том, что это «просто дешевое решение», требует уточнения в текущих рыночных условиях.

В 2026 году абсолютная стоимость HDD растет. Дефицит компонентов привел к тому, что цены на накопители Seagate IronWolf объемом 4 ТБ выросли с $80–$85 до $100, а модели на 12 и 16 ТБ подорожали на $20–$30 [!]. Производители, такие как Western Digital, все чаще переходят к долгосрочным контрактам с крупными заказчиками, чтобы гарантировать объемы поставок в условиях высокого спроса со стороны дата-центров [!]. Это создает ситуацию, где HDD остаются наиболее экономичным решением по сравнению с флеш-памятью, но их доступность для малого и среднего бизнеса ограничивается приоритетом поставок гигантам отрасли.

Флеш-память (Flash), несмотря на высокую скорость, проигрывает в экономическом расчете при масштабировании. Стоимость хранения на флеш-накопителях может быть в шесть раз выше, чем на HDD. Для задач машинного обучения, где критичен объем обучающих выборок, жесткие диски остаются безальтернативным решением для массового хранения.

Параметр сравненияЖесткие диски (HDD)Флеш-память (Flash)
Доля рынка~80% емкости дата-центровОстаток вместе с лентой
Стоимость масштабированияНизкая (но растет из-за дефицита)Высокая (в 6+ раз дороже HDD)
Оптимальная нагрузкаПропускная способность, объемные данныеВысокий IOPS, критичные по времени задачи
Роль в ИИХранение обучающих выборок, RAG-базыКэширование, активные вычисления

Производительность нельзя оценивать линейно. Флеш-накопители обеспечивают мгновенный отклик для транзакционных баз данных, тогда как HDD гарантируют стабильную работу с огромными массивами при минимальных затратах на гигабайт. Для бизнеса это означает, что попытка хранить «темные данные» на быстрых носителях приведет к необоснованному росту операционных расходов без реального прироста эффективности ИИ-моделей.

Важный нюанс: В условиях роста цен и дефицита компонентов стратегия выбора HDD трансформируется из простой экономии в механизм обеспечения доступности данных для будущего обучения, когда вычислительные мощности станут доступны.

Архитектура гибкости и риски изоляции

Современные предприятия внедряют многоуровневое хранение (Storage tiering) как стандарт индустрии. Этот подход позволяет динамически перемещать рабочие нагрузки между флеш-памятью, жесткими дисками и магнитной лентой в зависимости от требований к операциям ввода-вывода. Гиперскейлеры и облачные провайдеры используют гибридные пулы для обеспечения бесперебойной работы сервисов, автоматически распределяя «горячие» данные на быстрые носители, а менее активные массивы переводя на экономичные HDD.

Для реализации таких сценариев компании применяют технологии NVMe-over-Fabrics (NVMe-oF). Решения от Western Digital, включая платформы RapidFlex и OpenFlex Data 24, позволяют развязать хранение от вычислений. Это критически важно: бизнес получает возможность подбирать конкретную технологию хранения под каждую задачу, не привязываясь к жестким ограничениям устаревших архитектур.

Однако за технической гибкостью скрывается риск создания «цифровых кладбищ». Если инфраструктура позволяет хранить данные дешево, но не предоставляет эффективных инструментов для их анализа, компания рискует накопить гигантские объемы информации, которые невозможно использовать. Системы RAG (Retrieval-Augmented Generation) требуют доступа к структурированным и категоризированным данным. Без внедрения машинного обучения для предварительной обработки «темных данных», они останутся пассивным грузом, увеличивающим затраты на электроэнергию и обслуживание серверов.

Главным фактором успеха становится способность инфраструктуры обрабатывать разнородные данные, ранее находившиеся в изолированных хранилищах. Машинное обучение берет на себя задачу категоризации, превращая хаос в источник конкурентных преимуществ. Для минимизации рисков руководителям рекомендуется оценивать свои хранилища через призму многоуровневой архитектуры. Сохранение данных на HDD обеспечивает экономическую базу, а использование технологий развязки гарантирует гибкость при изменении требований бизнеса.

Стратегические выводы: ожидание и адаптация

Переход к модели вечного хранения меняет структуру затрат и приоритеты в ИТ-инфраструктуре. Компании, которые смогут эффективно управлять балансом между дешевым хранением на HDD и быстрым доступом через флеш-память, получат преимущество в гонке за внедрение генеративного ИИ. Однако текущая ситуация диктует необходимость стратегического ожидания.

Критический дефицит вычислительных мощностей, вызванный перераспределением производственных мощностей NVIDIA в пользу корпоративных заказов и монополией на сырье для чипов (стеклоткань T-glass), создает временной лаг между накоплением данных и их монетизацией [!] [!]. Баланс спроса и предложения на рынке ИИ-процессоров не восстановится до второй половины 2027 года. Это вынуждает компании хранить сырые данные на HDD «на потом», рассчитывая, что через 1–2 года, когда появятся новые чипы или восстановятся поставки, эти массивы станут золотом для обучения моделей.

Технологическая эволюция подтверждает этот вектор: Western Digital планирует к 2029 году выпуск жестких дисков емкостью до 100 ТБ благодаря технологии HAMR [!]. Это позволяет увеличить плотность записи и решать проблему физического пространства для «вечного хранения» без строительства новых дата-центров.

На фоне этого: Стратегия вечного хранения на HDD становится не просто способом экономии, а страховкой от дефицита вычислительных мощностей, позволяя бизнесу сохранить конкурентное преимущество до восстановления баланса рынка.

Рынок движется к модели, где стоимость данных определяется их потенциальной пользой для обучения моделей, а не стоимостью носителя. Бизнесу предстоит найти баланс между сохранением всего и умением работать с этим объемом, чтобы избежать ситуации, когда архив становится слишком тяжелым для использования. Успех зависит от способности превратить «темные данные» в структурированное сырье с помощью многоуровневой архитектуры хранения, готового к использованию в момент появления доступных вычислительных ресурсов.

Коротко о главном

Какой объем «темных данных» содержится в корпоративных хранилищах?

Пассивные массивы информации составляют от 50% до 90% всего объема данных в компаниях, создавая огромный резерв для извлечения бизнес-инсайтов при условии эффективной экстракции знаний.

Почему жесткие диски (HDD) сохраняют доминирующее положение на рынке хранения?

HDD обеспечивают около 80% емкости мировых дата-центров благодаря сочетанию высокой скорости извлечения информации и низкой стоимости владения по сравнению с альтернативами.

Во сколько раз флеш-память дороже жестких дисков при масштабировании?

Стоимость масштабирования на флеш-накопителях может превышать цену HDD более чем в шесть раз, что делает жесткие диски экономически выгодным решением для хранения больших объемов данных под задачи машинного обучения.

Какую роль играет многоуровневое хранение в современных дата-центрах?

Этот подход позволяет динамически перемещать рабочие нагрузки между быстрыми флеш-накопителями, HDD и магнитной лентой для оптимизации баланса между производительностью и затратами.

Зачем гиперскейлеры используют гибридные пулы хранения?

Крупные облачные провайдеры автоматически распределяют «горячие» данные на быстрые носители, а менее активные массивы переводят на экономичные HDD для обеспечения бесперебойной работы сервисов в рамках соглашений об уровне обслуживания.

Как технологии NVMe-over-Fabrics помогают оптимизировать инфраструктуру?

Решения вроде платформ RapidFlex и OpenFlex Data 24 от Western Digital позволяют развязать хранение от вычислений, давая возможность подбирать конкретную технологию под каждую задачу без привязки к устаревшим архитектурным ограничениям.

Как системы RAG используют «темные данные» для генеративного ИИ?

Технологии Retrieval-Augmented Generation обращаются к внутренним базам знаний и проприетарным массивам данных для повышения точности ответов моделей, превращая ранее изолированную информацию в конкурентное преимущество.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Бизнес; Аналитика и исследования; Управление и стратегия; Устройства и гаджеты; Комплектущие для ПК; Передовые технологии

Оценка значимости: 3 из 10

Описанная тенденция к изменению стратегий хранения данных и росту роли жестких дисков в эпоху искусственного интеллекта является глобальным технологическим трендом, однако для российской аудитории она представляет собой лишь косвенный интерес как часть общемирового развития IT-инфраструктуры. Событие затрагивает узкую сферу корпоративных технологий и не несет прямых системных последствий для экономики или общества России в краткосрочной перспективе, оставаясь фактором долгосрочного профессионального интереса для специалистов индустрии без широкого общественного резонанса.

Материалы по теме

Дефицит памяти: видеокарты и накопители подорожали в 2–3 раза

Конкретные цифры роста цен на накопители Seagate IronWolf (с $80–$85 до $100 за 4 ТБ и подорожание моделей 12/16 ТБ) служат эмпирическим доказательством тезиса о том, что абсолютная стоимость HDD растет в 2026 году, подтверждая наличие дефицита компонентов.

Подробнее →
HDD-дефицит 2026: как ИИ и дата-центры меняют бизнес Western Digital

Упоминание перехода производителей, таких как Western Digital, на долгосрочные контракты для гарантии поставок иллюстрирует изменение рыночной логики: доступность HDD для малого бизнеса ограничивается приоритетом гигантов отрасли в условиях высокого спроса дата-центров.

Подробнее →
Спрос на ИИ вытесняет геймеров с полок магазинов NVIDIA

Факт перераспределения производственных мощностей NVIDIA в пользу корпоративных заказов объясняет причину критического дефицита вычислительных мощностей, создавая аргумент для стратегии «стратегического ожидания» и накопления данных на HDD до восстановления баланса.

Подробнее →
Монополия на T-glass: дефицит удорожает ИИ-чипы на 30%

Информация о монополии на стеклоткань T-glass и прогнозе восстановления рынка только во второй половине 2027 года обосновывает временной лаг между накоплением данных и их монетизацией, превращая хранение в страховку от технологического дефицита.

Подробнее →
HAMR в Таиланде: как революция в хранении данных создает новые возможности для локальной промышленности

Планы Western Digital по выпуску жестких дисков емкостью до 100 ТБ к 2029 году благодаря технологии HAMR подтверждают вектор технологической эволюции, позволяя решить проблему физического пространства для «вечного хранения» без масштабирования дата-центров.

Подробнее →