Июнь 2026   |   Обзор события   | 7

Брайан Армстронг: 80% задач в ИИ перейдут на модели дешевле на 99%

Брайан Армстронг прогнозирует, что в ближайшие полтора года 80% задач будут решаться моделями, которые в 99 раз дешевле флагманских. Этот сдвиг от гонки мощностей к жесткой экономии подрывает бизнес-модели гигантов вроде OpenAI и заставит рынок пересмотреть спрос на вычислительные ресурсы.

ИСХОДНЫЙ НАРРАТИВ

По данным TechCrunch, в индустрии искусственного интеллекта назревает фундаментальный сдвиг, который может перекроить экономические правила игры. Долгое время развитие сектора строилось на убеждении, что самые мощные и крупные модели неизбежно выигрывают конкуренцию. Сейчас эта догма дает трещину под давлением растущих расходов. Компании вынуждены пересматривать свои подходы, обращая внимание на более компактные и дешевые решения. Этот тренд становится сигналом для глобального рынка, указывая на возможное изменение структуры спроса и цепочек поставок вычислительных мощностей.

Переход от гонки мощностей к экономической эффективности

Основной драйвер изменений — финансовая целесообразность. Сооснователь Coinbase Брайан Армстронг сформулировал прогноз, который может определить развитие отрасли на ближайший год. По его оценкам, спрос на интеллектуальные возможности практически безграничен, однако в течение 12–18 месяцев 80% рабочих задач будут выполняться на моделях, стоимость использования которых ниже на 99%. Оставшиеся 20% задач, требующие максимальной точности и интеллекта, продолжат работать на самых передовых версиях моделей.

Такой сценарий означает кардинальную трансформацию экономики ИИ. Ранее компании конкурировали преимущественно за качество, выбирая по умолчанию самые продвинутые доступные решения. Если окажется, что большинство задач можно решать с помощью более дешевых аналогов без потери результата, это нанесет серьезный удар по доходам крупных разработчиков. Финансовые потери могут коснуться таких гигантов, как OpenAI и Anthropic, которые готовятся к выходу на биржу. Снижение маржинальности на массовом сегменте задач заставит пересмотреть бизнес-модели, ориентированные на продажу доступа к флагманским моделям.

Практическая проверка гипотезы о малых моделях

Теоретические предположения уже находят подтверждение в реальных тестах. Юридический инструмент Harvey провел эксперимент в партнерстве с платформой Fireworks AI. Специалисты смогли сократить затраты на вывод данных (инференс) в три раза, не снизив качество услуг. В ходе теста система использовала комбинацию модели Claude Opus и более легкой модели GLM 5.1 от Fireworks. Сложные и ресурсоемкие задачи передавались мощной модели, в то время как рутинные операции выполнялись дешевым аналогом.

Сооснователь Harvey Гейб Перейра отметил, что качество остается приоритетом, особенно в юридической сфере. Однако само понятие качества меняется. Оно перестает означать использование самой мощной модели для каждой задачи и трансформируется в поиск наиболее эффективного решения, которое дает правильный ответ с минимальными затратами. Этот подход демонстрирует, что правильная архитектура системы позволяет заменять дорогие компоненты без ущерба для конечного результата.

Изменение ландшафта конкуренции и риски для индустрии

Реальное противостояние в отрасли смещается с битвы между проприетарными и открытыми моделями на конкуренцию между крупными и малыми моделями. Экономия достигается не обязательно при переходе на китайские аналоги или открытые веса, но и при выборе более легких версий от тех же поставщиков. Например, замена GPT-5.5 на GPT-5.4-mini дает тот же финансовый эффект, что и переход на сторонние решения.

Идет активная ценовая война между внутренними сервисами вывода крупных лабораторий и независимыми поставщиками. Ранее индустрия следовала принципу масштабирования, вдохновленная идеей о том, что больше вычислительных ресурсов всегда лучше. Инвесторы субсидировали высокие цены, и у клиентов не было стимула искать альтернативы. Сейчас, когда стоимость токенов растет, а субсидии сокращаются, бизнес сталкивается с реальным давлением издержек.

Существует риск, что компании не перейдут на малые модели, а просто сократят объем запросов или откажутся от менее перспективных проектов. Однако, если подтвердится, что большинство внедрений могут работать на упрощенных моделях, это может существенно затормозить рост спроса на инференс. Что ставит под вопрос экономическую обоснованность затрат на обучение самых мощных моделей, если рынок массовых задач уходит в сегмент дешевых решений.

Ситуация требует детального анализа со стороны руководителей и специалистов, так как текущие тренды указывают на необходимость пересмотра стратегий внедрения ИИ. Рынок движется от гонки параметров к оптимизации затрат, и компании, которые не адаптируются к новой экономической реальности, рискуют потерять конкурентные преимущества.

АНАЛИТИЧЕСКИЙ РАЗБОР

Экономика выживания: почему гонка за мощными моделями зашла в тупик

Технологический сектор искусственного интеллекта переживает переломный момент. Долгое время индустрия развивалась по принципу «чем больше параметров, тем лучше», полагая, что только флагманские модели способны решать сложные задачи. Однако финансовая реальность вносит коррективы. Рост расходов на вычислительные мощности и токены вынуждает компании искать баланс между качеством и стоимостью. Тренд смещается от бесконечного масштабирования к жесткой оптимизации затрат.

Прогноз сооснователя Coinbase Брайана Армстронга рисует картину, которая может стать шоком для многих игроков рынка. По его оценкам, в течение ближайших 12–18 месяцев 80% рабочих задач будут выполняться на моделях, стоимость использования которых ниже на 99%. Оставшиеся 20% задач, требующие предельной точности, останутся за флагманскими решениями.

Такой сценарий разрушает привычную логику продаж. Ранее компании конкурировали за качество, предлагая клиентам самые продвинутые версии по умолчанию. Если окажется, что для большинства рутинных операций достаточно дешевых аналогов, доходы крупных разработчиков, таких как OpenAI и Anthropic, могут резко сократиться. Эти компании готовятся к выходу на биржу, и их оценка во многом строится на ожидании бесконечного роста спроса на их топовые продукты. Снижение маржинальности в массовом сегменте задач заставит пересмотреть бизнес-модели, ориентированные на продажу доступа к флагманским моделям.

Важный нюанс: Основной риск для индустрии заключается не в появлении более дешевых конкурентов, а в том, что клиенты перестанут видеть ценность в переплате за избыточную мощность там, где она не требуется.

Реальность против теории: урок из юридической сферы

Теоретические предположения уже находят подтверждение в практике. Юридический инструмент Harvey провел эксперимент в партнерстве с платформой Fireworks AI, который наглядно демонстрирует потенциал гибридного подхода. Специалисты смогли сократить затраты на вывод данных в три раза, не снизив качество услуг. В ходе теста система использовала комбинацию мощной модели Claude Opus и более легкой модели GLM 5.1. Сложные и ресурсоемкие задачи передавались мощной модели, в то время как рутинные операции выполнялись дешевым аналогом.

Гейб Перейра, сооснователь Harvey, отметил, что качество остается приоритетом, особенно в юридической сфере. Однако само понятие качества меняется. Оно перестает означать использование самой мощной модели для каждой задачи и трансформируется в поиск наиболее эффективного решения, которое дает правильный ответ с минимальными затратами.

Этот пример показывает, что правильная архитектура системы позволяет заменять дорогие компоненты без ущерба для конечного результата. Компании, которые смогут выстроить такие гибкие системы, получат значительное преимущество. Они смогут предлагать услуги по конкурентным ценам, сохраняя при этом высокую рентабельность. В то же время, поставщики, предлагающие только дорогие решения без возможности их адаптации, рискуют потерять долю рынка.

Новая карта конкуренции и скрытые угрозы

Реальное противостояние в отрасли смещается с битвы между проприетарными и открытыми моделями на конкуренцию между крупными и малыми моделями. Экономия достигается не обязательно при переходе на китайские аналоги или открытые веса, но и при выборе более легких версий от тех же поставщиков. Например, замена GPT-5.5 на GPT-5.4-mini дает тот же финансовый эффект, что и переход на сторонние решения.

Идет активная ценовая война между внутренними сервисами вывода крупных лабораторий и независимыми поставщиками. Ранее индустрия следовала принципу масштабирования, вдохновленная идеей о том, что больше вычислительных ресурсов всегда лучше. Инвесторы субсидировали высокие цены, и у клиентов не было стимула искать альтернативы. Сейчас, когда стоимость токенов растет, а субсидии сокращаются, бизнес сталкивается с реальным давлением издержек.

Существует риск, что компании не перейдут на малые модели, а просто сократят объем запросов или откажутся от менее перспективных проектов. Однако, если подтвердится, что большинство внедрений могут работать на упрощенных моделях, это может существенно затормозить рост спроса на инференс. Это ставит под вопрос экономическую обоснованность затрат на обучение самых мощных моделей, если рынок массовых задач уходит в сегмент дешевых решений.

Стоит учесть: Сдвиг в сторону малых моделей может привести к тому, что инвестиции в создание сверхмощных систем станут менее привлекательными для инвесторов, так как их окупаемость будет зависеть от узкого круга сложных задач.

Для российского бизнеса этот тренд означает необходимость пересмотра стратегий внедрения ИИ. Вместо слепого копирования западных практик использования самых дорогих моделей, компании должны анализировать свои задачи и выбирать оптимальное соотношение цены и качества. Это позволит снизить зависимость от внешних поставщиков и оптимизировать расходы. Рынок движется от гонки параметров к оптимизации затрат, и компании, которые не адаптируются к новой экономической реальности, рискуют потерять конкурентные преимущества.

Конфликт ожиданий и экономической реальности

Однако оптимистичный сценарий перехода на дешевые модели сталкивается с суровой экономической реальностью. Данные показывают, что автоматизация не всегда дешевле живого труда. Исследование, проведенное в компании Swan AI, выявило, что в 77% случаев человек экономически эффективнее ИИ-агента. Расходы на токены для одного сотрудника составили около 28 000 долларов в месяц, что превысило его заработную плату [!]. Это ставит под сомнение саму идею тотальной замены персонала, если стоимость использования моделей остается высокой.

Более того, прогнозы о массовом замещении задач могут быть завышены. Исследование OpenAI и Anthropic показало, что реальная автоматизация охватывает лишь около 15% задач, а не 80%, как предполагалось в ранних оценках [!]. Это означает, что переход на дешевые модели может быть не столько стратегией роста, сколько попыткой бизнеса выжить в условиях переоцененного рынка. Компании вынуждены снижать маржу, чтобы оправдать инвестиции в технологии, которые пока не приносят ожидаемой отдачи.

Для российских компаний этот контекст особенно важен. Успешный кейс ритейлера X5 демонстрирует, что прибыль от ИИ (5 млрд рублей) достигается не за счет смены моделей, а благодаря переходу от пилотных проектов к промышленной эксплуатации и централизации инфраструктуры [!]. Это подтверждает, что эффективность зависит от качества внедрения и масштаба использования, а не только от выбора конкретной нейросети.

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

Риски потери контроля и новые возможности

Переход на более дешевые решения несет в себе новые риски. Поставщики ИИ, включая OpenAI и Anthropic, могут менять алгоритмы без предупреждения, что влияет на стабильность бизнес-процессов [!]. Модель оплаты за объем использованных токенов создает для вендоров финансовую мотивацию вносить изменения, потенциально увеличивающие потребление токенов и затраты клиентов. Клиенты теряют контроль над качеством инструментов, за которые платят миллиарды долларов, так как внутренняя оптимизация может привести к непредвиденной деградации производительности.

В то же время, рынок предлагает альтернативы, которые позволяют снизить зависимость от западных поставщиков. Модель DeepSeek V4 демонстрирует возможность снижения затрат на ИИ до 90% при отказе от оборудования Nvidia и использовании ускорителей Huawei Ascend [!]. Открытый код агентов ИИ от Xiaomi позволяет бизнесу снизить расходы на 40–60% за счет оптимизации использования токенов и возможности самостоятельного развертывания систем [!]. Эти решения становятся особенно актуальными в условиях санкций и необходимости импортозамещения.

Таким образом, индустрия искусственного интеллекта находится на перепутье. Гонка за мощными моделями уступает место поиску рентабельных решений. Компании, которые смогут сбалансировать качество, стоимость и контроль над процессами, получат преимущество. Остальные рискуют остаться с дорогими технологиями, которые не приносят ожидаемой отдачи.

На фоне этого: Переход на малые модели — это не эволюция, а вынужденная мера по выживанию бизнеса в условиях, когда стоимость ИИ-агентов все еще превышает стоимость человеческого труда, а реальный потенциал автоматизации сильно завышен.

Коротко о главном

Какой прогноз Брайан Армстронг сделал относительно стоимости выполнения задач через 12–18 месяцев?

Сооснователь Coinbase предсказывает, что 80% рабочих задач будут решаться моделями с ценой использования на 99% ниже, поскольку для большинства операций не требуется максимальный интеллект.

К каким финансовым последствиям приведет массовый переход на дешевые модели для OpenAI и Anthropic?

Снижение маржинальности на массовом сегменте задач нанесет удар по доходам гигантов, заставив их пересмотреть бизнес-модели перед выходом на биржу.

Какой результат показал эксперимент юридического инструмента Harvey с платформой Fireworks AI?

Компания сократила затраты на вывод данных в три раза без потери качества, передавая сложные задачи модели Claude Opus, а рутинные — более легкой модели GLM 5.1.

Как изменилось понятие качества в сфере искусственного интеллекта по мнению Гейба Перейры?

Приоритет сместился с использования самой мощной модели для каждой задачи на поиск наиболее эффективного решения, дающего правильный ответ с минимальными затратами.

Почему конкуренция сместилась с битвы проприетарных и открытых моделей на противостояние крупных и малых версий?

Экономия достигается не только переходом на сторонние решения, но и заменой флагманских версий (например, GPT-5.5) на их облегченные аналоги (GPT-5.4-mini) от тех же поставщиков.

Что стало причиной начала ценовой войны между крупными лабораториями и независимыми поставщиками?

Исчезновение стимулов для клиентов искать альтернативы из-за сокращения инвесторских субсидий и роста стоимости токенов привело к реальному давлению издержек на бизнес.

Какой риск несет для индустрии подтверждение гипотезы о работе массовых задач на упрощенных моделях?

Это может существенно затормозить рост спроса на инференс и поставить под вопрос экономическую обоснованность затрат на обучение самых мощных моделей.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Бизнес; Аналитика и исследования; Тренды и кейсы; Управление и стратегия; Финансы

Оценка значимости: 7 из 10

Событие представляет собой глобальный структурный сдвиг в экономике искусственного интеллекта, который напрямую влияет на технологический суверенитет и конкурентоспособность российской экономики в горизонте 6–12 месяцев. Переход от гонки мощностей к оптимизации затрат меняет правила игры для всех участников рынка, включая российские компании, вынужденные адаптировать свои стратегии внедрения ИИ в условиях ограниченных ресурсов и санкционных ограничений. Глубина последствий затрагивает экономику, технологии и бизнес-модели, создавая долгосрочный тренд, требующий пересмотра подходов к развитию отечественных решений и импортозамещения в сфере вычислительных мощностей.

Материалы по теме

Поставщики ИИ меняют алгоритмы без предупреждения и снижают качество кода

Факт о том, что поставщики меняют алгоритмы без предупреждения, служит ключевым аргументом в разделе о рисках потери контроля. Эти данные иллюстрируют уязвимость бизнес-процессов, показывая, как модель оплаты за токены создает финансовую мотивацию для вендоров вносить изменения, ведущие к деградации производительности и потере клиентами контроля над инструментами.

Подробнее →
DeepSeek V4: снижение затрат на ИИ до 90% при отказе от Nvidia

Данные о модели DeepSeek V4 и снижении затрат на 90% при отказе от оборудования Nvidia используются для демонстрации реальных альтернатив западным поставщикам. Этот пример подкрепляет тезис о возможности импортозамещения и оптимизации расходов через использование ускорителей Huawei Ascend, делая аргументацию о снижении зависимости от внешних технологий конкретной и измеримой.

Подробнее →
Xiaomi открыла код агентов ИИ: снижение затрат на 40–60% против закрытых моделей

Информация об открытом коде агентов от Xiaomi, позволяющем сократить расходы на 40–60%, работает как доказательство эффективности гибридных стратегий. Этот факт усиливает позицию о том, что самостоятельное развертывание систем и оптимизация использования токенов становятся критически важными для бизнеса в условиях санкций, предлагая конкретный путь к снижению зависимости от проприетарных API.

Подробнее →
ИИ дороже людей: в 77% случаев человек экономически эффективнее

Статистика из исследования Swan AI, согласно которой в 77% случаев человек эффективнее ИИ-агента, становится центральным контраргументом против идеи тотальной автоматизации. Цифры о расходах в 28 000 долларов на токены против зарплаты сотрудника разрушают миф о неизбежной дешевизне ИИ, подчеркивая экономическую нелогичность замены персонала на текущем этапе развития технологий.

Подробнее →
Прогнозы ИИ о замене труда: реальный охват задач составляет лишь 15%

Данные о реальном охвате автоматизации в 15% вместо прогнозируемых 80% используются для деконструкции оптимистичных сценариев замещения труда. Этот факт из исследования OpenAI и Anthropic показывает разрыв между теоретическими ожиданиями и практикой, аргументируя мысль о том, что переход на дешевые модели является скорее вынужденной мерой выживания, чем стратегией роста.

Подробнее →
X5 получила 5 млрд рублей прибыли от ИИ за счет перехода к промышленному использованию

Кейс ритейлера X5 с прибылью в 5 млрд рублей служит практическим подтверждением того, что эффективность ИИ зависит от масштаба внедрения и централизации, а не от выбора конкретной модели. Этот пример перенаправляет фокус с гонки за параметрами на качество промышленной эксплуатации, демонстрируя успешную стратегию для российского бизнеса.

Подробнее →