Брайан Армстронг: 80% задач в ИИ перейдут на модели дешевле на 99%
Брайан Армстронг прогнозирует, что в ближайшие полтора года 80% задач будут решаться моделями, которые в 99 раз дешевле флагманских. Этот сдвиг от гонки мощностей к жесткой экономии подрывает бизнес-модели гигантов вроде OpenAI и заставит рынок пересмотреть спрос на вычислительные ресурсы.
По данным TechCrunch, в индустрии искусственного интеллекта назревает фундаментальный сдвиг, который может перекроить экономические правила игры. Долгое время развитие сектора строилось на убеждении, что самые мощные и крупные модели неизбежно выигрывают конкуренцию. Сейчас эта догма дает трещину под давлением растущих расходов. Компании вынуждены пересматривать свои подходы, обращая внимание на более компактные и дешевые решения. Этот тренд становится сигналом для глобального рынка, указывая на возможное изменение структуры спроса и цепочек поставок вычислительных мощностей.
Переход от гонки мощностей к экономической эффективности
Основной драйвер изменений — финансовая целесообразность. Сооснователь Coinbase Брайан Армстронг сформулировал прогноз, который может определить развитие отрасли на ближайший год. По его оценкам, спрос на интеллектуальные возможности практически безграничен, однако в течение 12–18 месяцев 80% рабочих задач будут выполняться на моделях, стоимость использования которых ниже на 99%. Оставшиеся 20% задач, требующие максимальной точности и интеллекта, продолжат работать на самых передовых версиях моделей.
Такой сценарий означает кардинальную трансформацию экономики ИИ. Ранее компании конкурировали преимущественно за качество, выбирая по умолчанию самые продвинутые доступные решения. Если окажется, что большинство задач можно решать с помощью более дешевых аналогов без потери результата, это нанесет серьезный удар по доходам крупных разработчиков. Финансовые потери могут коснуться таких гигантов, как OpenAI и Anthropic, которые готовятся к выходу на биржу. Снижение маржинальности на массовом сегменте задач заставит пересмотреть бизнес-модели, ориентированные на продажу доступа к флагманским моделям.
Практическая проверка гипотезы о малых моделях
Теоретические предположения уже находят подтверждение в реальных тестах. Юридический инструмент Harvey провел эксперимент в партнерстве с платформой Fireworks AI. Специалисты смогли сократить затраты на вывод данных (инференс) в три раза, не снизив качество услуг. В ходе теста система использовала комбинацию модели Claude Opus и более легкой модели GLM 5.1 от Fireworks. Сложные и ресурсоемкие задачи передавались мощной модели, в то время как рутинные операции выполнялись дешевым аналогом.
Сооснователь Harvey Гейб Перейра отметил, что качество остается приоритетом, особенно в юридической сфере. Однако само понятие качества меняется. Оно перестает означать использование самой мощной модели для каждой задачи и трансформируется в поиск наиболее эффективного решения, которое дает правильный ответ с минимальными затратами. Этот подход демонстрирует, что правильная архитектура системы позволяет заменять дорогие компоненты без ущерба для конечного результата.
Изменение ландшафта конкуренции и риски для индустрии
Реальное противостояние в отрасли смещается с битвы между проприетарными и открытыми моделями на конкуренцию между крупными и малыми моделями. Экономия достигается не обязательно при переходе на китайские аналоги или открытые веса, но и при выборе более легких версий от тех же поставщиков. Например, замена GPT-5.5 на GPT-5.4-mini дает тот же финансовый эффект, что и переход на сторонние решения.
Идет активная ценовая война между внутренними сервисами вывода крупных лабораторий и независимыми поставщиками. Ранее индустрия следовала принципу масштабирования, вдохновленная идеей о том, что больше вычислительных ресурсов всегда лучше. Инвесторы субсидировали высокие цены, и у клиентов не было стимула искать альтернативы. Сейчас, когда стоимость токенов растет, а субсидии сокращаются, бизнес сталкивается с реальным давлением издержек.
Существует риск, что компании не перейдут на малые модели, а просто сократят объем запросов или откажутся от менее перспективных проектов. Однако, если подтвердится, что большинство внедрений могут работать на упрощенных моделях, это может существенно затормозить рост спроса на инференс. Что ставит под вопрос экономическую обоснованность затрат на обучение самых мощных моделей, если рынок массовых задач уходит в сегмент дешевых решений.
Ситуация требует детального анализа со стороны руководителей и специалистов, так как текущие тренды указывают на необходимость пересмотра стратегий внедрения ИИ. Рынок движется от гонки параметров к оптимизации затрат, и компании, которые не адаптируются к новой экономической реальности, рискуют потерять конкурентные преимущества.
Экономика выживания: почему гонка за мощными моделями зашла в тупик
Технологический сектор искусственного интеллекта переживает переломный момент. Долгое время индустрия развивалась по принципу «чем больше параметров, тем лучше», полагая, что только флагманские модели способны решать сложные задачи. Однако финансовая реальность вносит коррективы. Рост расходов на вычислительные мощности и токены вынуждает компании искать баланс между качеством и стоимостью. Тренд смещается от бесконечного масштабирования к жесткой оптимизации затрат.
Прогноз сооснователя Coinbase Брайана Армстронга рисует картину, которая может стать шоком для многих игроков рынка. По его оценкам, в течение ближайших 12–18 месяцев 80% рабочих задач будут выполняться на моделях, стоимость использования которых ниже на 99%. Оставшиеся 20% задач, требующие предельной точности, останутся за флагманскими решениями.
Такой сценарий разрушает привычную логику продаж. Ранее компании конкурировали за качество, предлагая клиентам самые продвинутые версии по умолчанию. Если окажется, что для большинства рутинных операций достаточно дешевых аналогов, доходы крупных разработчиков, таких как OpenAI и Anthropic, могут резко сократиться. Эти компании готовятся к выходу на биржу, и их оценка во многом строится на ожидании бесконечного роста спроса на их топовые продукты. Снижение маржинальности в массовом сегменте задач заставит пересмотреть бизнес-модели, ориентированные на продажу доступа к флагманским моделям.
Важный нюанс: Основной риск для индустрии заключается не в появлении более дешевых конкурентов, а в том, что клиенты перестанут видеть ценность в переплате за избыточную мощность там, где она не требуется.
Реальность против теории: урок из юридической сферы
Теоретические предположения уже находят подтверждение в практике. Юридический инструмент Harvey провел эксперимент в партнерстве с платформой Fireworks AI, который наглядно демонстрирует потенциал гибридного подхода. Специалисты смогли сократить затраты на вывод данных в три раза, не снизив качество услуг. В ходе теста система использовала комбинацию мощной модели Claude Opus и более легкой модели GLM 5.1. Сложные и ресурсоемкие задачи передавались мощной модели, в то время как рутинные операции выполнялись дешевым аналогом.
Гейб Перейра, сооснователь Harvey, отметил, что качество остается приоритетом, особенно в юридической сфере. Однако само понятие качества меняется. Оно перестает означать использование самой мощной модели для каждой задачи и трансформируется в поиск наиболее эффективного решения, которое дает правильный ответ с минимальными затратами.
Этот пример показывает, что правильная архитектура системы позволяет заменять дорогие компоненты без ущерба для конечного результата. Компании, которые смогут выстроить такие гибкие системы, получат значительное преимущество. Они смогут предлагать услуги по конкурентным ценам, сохраняя при этом высокую рентабельность. В то же время, поставщики, предлагающие только дорогие решения без возможности их адаптации, рискуют потерять долю рынка.
Новая карта конкуренции и скрытые угрозы
Реальное противостояние в отрасли смещается с битвы между проприетарными и открытыми моделями на конкуренцию между крупными и малыми моделями. Экономия достигается не обязательно при переходе на китайские аналоги или открытые веса, но и при выборе более легких версий от тех же поставщиков. Например, замена GPT-5.5 на GPT-5.4-mini дает тот же финансовый эффект, что и переход на сторонние решения.
Идет активная ценовая война между внутренними сервисами вывода крупных лабораторий и независимыми поставщиками. Ранее индустрия следовала принципу масштабирования, вдохновленная идеей о том, что больше вычислительных ресурсов всегда лучше. Инвесторы субсидировали высокие цены, и у клиентов не было стимула искать альтернативы. Сейчас, когда стоимость токенов растет, а субсидии сокращаются, бизнес сталкивается с реальным давлением издержек.
Существует риск, что компании не перейдут на малые модели, а просто сократят объем запросов или откажутся от менее перспективных проектов. Однако, если подтвердится, что большинство внедрений могут работать на упрощенных моделях, это может существенно затормозить рост спроса на инференс. Это ставит под вопрос экономическую обоснованность затрат на обучение самых мощных моделей, если рынок массовых задач уходит в сегмент дешевых решений.
Стоит учесть: Сдвиг в сторону малых моделей может привести к тому, что инвестиции в создание сверхмощных систем станут менее привлекательными для инвесторов, так как их окупаемость будет зависеть от узкого круга сложных задач.
Для российского бизнеса этот тренд означает необходимость пересмотра стратегий внедрения ИИ. Вместо слепого копирования западных практик использования самых дорогих моделей, компании должны анализировать свои задачи и выбирать оптимальное соотношение цены и качества. Это позволит снизить зависимость от внешних поставщиков и оптимизировать расходы. Рынок движется от гонки параметров к оптимизации затрат, и компании, которые не адаптируются к новой экономической реальности, рискуют потерять конкурентные преимущества.
Конфликт ожиданий и экономической реальности
Однако оптимистичный сценарий перехода на дешевые модели сталкивается с суровой экономической реальностью. Данные показывают, что автоматизация не всегда дешевле живого труда. Исследование, проведенное в компании Swan AI, выявило, что в 77% случаев человек экономически эффективнее ИИ-агента. Расходы на токены для одного сотрудника составили около 28 000 долларов в месяц, что превысило его заработную плату [!]. Это ставит под сомнение саму идею тотальной замены персонала, если стоимость использования моделей остается высокой.
Более того, прогнозы о массовом замещении задач могут быть завышены. Исследование OpenAI и Anthropic показало, что реальная автоматизация охватывает лишь около 15% задач, а не 80%, как предполагалось в ранних оценках [!]. Это означает, что переход на дешевые модели может быть не столько стратегией роста, сколько попыткой бизнеса выжить в условиях переоцененного рынка. Компании вынуждены снижать маржу, чтобы оправдать инвестиции в технологии, которые пока не приносят ожидаемой отдачи.
Для российских компаний этот контекст особенно важен. Успешный кейс ритейлера X5 демонстрирует, что прибыль от ИИ (5 млрд рублей) достигается не за счет смены моделей, а благодаря переходу от пилотных проектов к промышленной эксплуатации и централизации инфраструктуры [!]. Это подтверждает, что эффективность зависит от качества внедрения и масштаба использования, а не только от выбора конкретной нейросети.

Риски потери контроля и новые возможности
Переход на более дешевые решения несет в себе новые риски. Поставщики ИИ, включая OpenAI и Anthropic, могут менять алгоритмы без предупреждения, что влияет на стабильность бизнес-процессов [!]. Модель оплаты за объем использованных токенов создает для вендоров финансовую мотивацию вносить изменения, потенциально увеличивающие потребление токенов и затраты клиентов. Клиенты теряют контроль над качеством инструментов, за которые платят миллиарды долларов, так как внутренняя оптимизация может привести к непредвиденной деградации производительности.
В то же время, рынок предлагает альтернативы, которые позволяют снизить зависимость от западных поставщиков. Модель DeepSeek V4 демонстрирует возможность снижения затрат на ИИ до 90% при отказе от оборудования Nvidia и использовании ускорителей Huawei Ascend [!]. Открытый код агентов ИИ от Xiaomi позволяет бизнесу снизить расходы на 40–60% за счет оптимизации использования токенов и возможности самостоятельного развертывания систем [!]. Эти решения становятся особенно актуальными в условиях санкций и необходимости импортозамещения.
Таким образом, индустрия искусственного интеллекта находится на перепутье. Гонка за мощными моделями уступает место поиску рентабельных решений. Компании, которые смогут сбалансировать качество, стоимость и контроль над процессами, получат преимущество. Остальные рискуют остаться с дорогими технологиями, которые не приносят ожидаемой отдачи.
На фоне этого: Переход на малые модели — это не эволюция, а вынужденная мера по выживанию бизнеса в условиях, когда стоимость ИИ-агентов все еще превышает стоимость человеческого труда, а реальный потенциал автоматизации сильно завышен.
Источник: TechCrunch