Mercor: ИИ-агенты справляются с профессиональными задачами лишь в 23% случаев
Бенчмарк Mercor развенчивает миф о полной автоматизации: передовые модели справляются с реальными офисными задачами лишь в 24% случаев из-за неспособности связывать разрозненные данные.
От хайпа к реальности: проверка на прочность
Рынок искусственного интеллекта переживает момент переоценки ожиданий. Если в 2025 году технологический сектор США генерировал триллионы долларов капитала и создавал новых миллиардеров, то к началу 2026 года фокус сместился с масштабных инвестиций на проверку реальной эффективности алгоритмов. Компания Mercor, основанная молодыми предпринимателями Бреннаном Фауди (Brennan Foudy), Адаршем Хирематом (Adarsh Hiremath) и Сурья Мидхой (Sourya Midha), стала одним из центральных игроков в этом процессе. Стартап, выросший из проекта по автоматизации найма, трансформировался в ключевую площадку для создания сред обучения с подкреплением и оценки способностей ИИ-агентов.
Важный нюанс: Быстрый рост капитализации Mercor до более чем $10 млрд свидетельствует не столько о зрелости технологии, сколько о готовности инвесторов платить за инструменты, способные отделить реальные возможности ИИ от маркетинговых обещаний.
История компании демонстрирует типичную для отрасли динамику: от создания ИИ-рекрутера до разработки сложных симуляторов для юриспруденции и здравоохранения. В 2025 году фонд Thiel Macro Питера Тиля (Peter Thiel) перенаправил капитал из акций Nvidia в такие активы, как Mercor, сигнализируя о смене стратегии. Инвесторы начали опасаться перегрева рынка чипов и ищут точки роста в программном обеспечении и инфраструктуре для обучения моделей. Это решение подтверждает, что капитал течет туда, где создаются условия для следующего качественного скачка в развитии алгоритмов.
Границы возможностей: тест APEX-Agents
В январе 2026 года Mercor представил бенчмарк APEX-Agents, результаты которого стали для оптимистов. Тестирование показало, что даже передовые модели, такие как Gemini 3 Flash и GPT-5.2, справляются с профессиональными офисными задачами лишь в 23–24% случаев. Основная проблема кроется не в отсутствии знаний у нейросетей, а в неспособности эффективно интегрировать данные из разрозненных источников. Реальная работа юриста или аналитика требует одновременного взаимодействия с несколькими платформами, синтеза информации и принятия решений в условиях неопределенности, что пока остается за пределами возможностей текущих агентских моделей.
Стоит учесть: Низкий процент успешного выполнения задач указывает на то, что автоматизация высококвалифицированного труда потребует не просто более мощных моделей, а принципиально новых архитектур, способных работать с контекстом и разнородными данными.
Этот результат меняет восприятие перспектив автоматизации. Вместо немедленного вытеснения специалистов рынок движется к созданию гибридных систем, где ИИ выступает в роли ассистента, а не замены. Для бизнеса это означает, что инвестиции в полную автоматизацию сложных процессов пока не окупаются, а фокус смещается на инструменты, повышающие эффективность человека.
Сигнал для рынка: куда двигаться дальше
Ситуация вокруг Mercor и результатов их тестов формирует четкий сигнал для глобального рынка технологий. Рост стоимости компаний, создающих среды для обучения ИИ, и одновременное признание ограничений текущих моделей указывают на переход от фазы «любых экспериментов» к фазе «инженерной точности». Для России это означает, что при планировании цифровизации и внедрения ИИ в госсектор и бизнес стоит ориентироваться на реалистичные сценарии. Ожидать полной автономности систем в сложных междисциплинарных задачах в ближайшие годы преждевременно.
Ключевые выводы для участников рынка:
- Смена приоритетов: Инвестиции смещаются с аппаратного обеспечения (чипы) на программные решения и данные для обучения.
- Реалистичные прогнозы: Автоматизация рутинных операций возможна, но сложные аналитические и юридические задачи требуют человеческого контроля.
- Новые ниши: Рынок растет в сегменте создания симуляторов и тестовых сред, что открывает возможности для локальных разработчиков, специализирующихся на данных.
На фоне этого: Успех Mercor показывает, что будущее ИИ-индустрии принадлежит не тем, кто создает самые большие модели, а тем, кто умеет проверять их на прочность и создавать условия для их безопасного обучения.
Таким образом, история Mercor иллюстрирует зрелость рынка: от эйфории роста к прагматичной оценке границ технологий. Для профессионалов это повод пересмотреть стратегии внедрения ИИ, сделав ставку на инструменты, которые усиливают компетенции сотрудников, а не заменяют их.
🤖 Сводка сформирована нейросетью на основе фактов из Календаря. Мы обновляем аналитический дайджест при необходимости — факты и хронология всегда доступны в Календаре ниже для проверки и изучения.
📅 Последнее обновление сводки: 8 мая 2026.