8 мая 2026   |   Живая аналитика

Mercor: ИИ-агенты справляются с профессиональными задачами лишь в 23% случаев

Бенчмарк Mercor развенчивает миф о полной автоматизации: передовые модели справляются с реальными офисными задачами лишь в 24% случаев из-за неспособности связывать разрозненные данные.

От хайпа к реальности: проверка на прочность

Рынок искусственного интеллекта переживает момент переоценки ожиданий. Если в 2025 году технологический сектор США генерировал триллионы долларов капитала и создавал новых миллиардеров, то к началу 2026 года фокус сместился с масштабных инвестиций на проверку реальной эффективности алгоритмов. Компания Mercor, основанная молодыми предпринимателями Бреннаном Фауди (Brennan Foudy), Адаршем Хирематом (Adarsh Hiremath) и Сурья Мидхой (Sourya Midha), стала одним из центральных игроков в этом процессе. Стартап, выросший из проекта по автоматизации найма, трансформировался в ключевую площадку для создания сред обучения с подкреплением и оценки способностей ИИ-агентов.

Важный нюанс: Быстрый рост капитализации Mercor до более чем $10 млрд свидетельствует не столько о зрелости технологии, сколько о готовности инвесторов платить за инструменты, способные отделить реальные возможности ИИ от маркетинговых обещаний.

История компании демонстрирует типичную для отрасли динамику: от создания ИИ-рекрутера до разработки сложных симуляторов для юриспруденции и здравоохранения. В 2025 году фонд Thiel Macro Питера Тиля (Peter Thiel) перенаправил капитал из акций Nvidia в такие активы, как Mercor, сигнализируя о смене стратегии. Инвесторы начали опасаться перегрева рынка чипов и ищут точки роста в программном обеспечении и инфраструктуре для обучения моделей. Это решение подтверждает, что капитал течет туда, где создаются условия для следующего качественного скачка в развитии алгоритмов.

Границы возможностей: тест APEX-Agents

В январе 2026 года Mercor представил бенчмарк APEX-Agents, результаты которого стали для оптимистов. Тестирование показало, что даже передовые модели, такие как Gemini 3 Flash и GPT-5.2, справляются с профессиональными офисными задачами лишь в 23–24% случаев. Основная проблема кроется не в отсутствии знаний у нейросетей, а в неспособности эффективно интегрировать данные из разрозненных источников. Реальная работа юриста или аналитика требует одновременного взаимодействия с несколькими платформами, синтеза информации и принятия решений в условиях неопределенности, что пока остается за пределами возможностей текущих агентских моделей.

Стоит учесть: Низкий процент успешного выполнения задач указывает на то, что автоматизация высококвалифицированного труда потребует не просто более мощных моделей, а принципиально новых архитектур, способных работать с контекстом и разнородными данными.

Этот результат меняет восприятие перспектив автоматизации. Вместо немедленного вытеснения специалистов рынок движется к созданию гибридных систем, где ИИ выступает в роли ассистента, а не замены. Для бизнеса это означает, что инвестиции в полную автоматизацию сложных процессов пока не окупаются, а фокус смещается на инструменты, повышающие эффективность человека.

Сигнал для рынка: куда двигаться дальше

Ситуация вокруг Mercor и результатов их тестов формирует четкий сигнал для глобального рынка технологий. Рост стоимости компаний, создающих среды для обучения ИИ, и одновременное признание ограничений текущих моделей указывают на переход от фазы «любых экспериментов» к фазе «инженерной точности». Для России это означает, что при планировании цифровизации и внедрения ИИ в госсектор и бизнес стоит ориентироваться на реалистичные сценарии. Ожидать полной автономности систем в сложных междисциплинарных задачах в ближайшие годы преждевременно.

Ключевые выводы для участников рынка:

  • Смена приоритетов: Инвестиции смещаются с аппаратного обеспечения (чипы) на программные решения и данные для обучения.
  • Реалистичные прогнозы: Автоматизация рутинных операций возможна, но сложные аналитические и юридические задачи требуют человеческого контроля.
  • Новые ниши: Рынок растет в сегменте создания симуляторов и тестовых сред, что открывает возможности для локальных разработчиков, специализирующихся на данных.

На фоне этого: Успех Mercor показывает, что будущее ИИ-индустрии принадлежит не тем, кто создает самые большие модели, а тем, кто умеет проверять их на прочность и создавать условия для их безопасного обучения.

Таким образом, история Mercor иллюстрирует зрелость рынка: от эйфории роста к прагматичной оценке границ технологий. Для профессионалов это повод пересмотреть стратегии внедрения ИИ, сделав ставку на инструменты, которые усиливают компетенции сотрудников, а не заменяют их.

🤖 Сводка сформирована нейросетью на основе фактов из Календаря. Мы обновляем аналитический дайджест при необходимости — факты и хронология всегда доступны в Календаре ниже для проверки и изучения.
📅 Последнее обновление сводки: 8 мая 2026.


Ключевые сюжеты

Новый бенчмарк APEX-Agents от Mercor выявил критическую слабость современных моделей: они справляются со сложными офисными задачами лишь в 24% случаев. Основная проблема кроется в неспособности ИИ синтезировать данные из разрозненных источников, что делает полную автоматизацию работы юристов и аналитиков невозможной в текущих реалиях.

Запуск бенчмарка APEX-Agents

Компания Mercor представила тестовую среду для оценки способностей ИИ-агентов в профессиональных задачах. Тест показал, что даже передовые модели, такие как Gemini 3 Flash и GPT-5.2, демонстрируют низкую эффективность в реальных сценариях.

📅 2026-01-23
Читать источник →

Выявление системного барьера

Главной причиной низкой результативности стала невозможность интеграции данных из разных платформ. ИИ-модели не могут эффективно работать в условиях, требующих одновременного взаимодействия с несколькими системами, что характерно для высококвалифицированного труда.

📅 2026-01-23
Читать источник →

Сдвиг фокуса автоматизации

Рынок скорректирует ожидания: вместо полной замены специалистов компании будут внедрять ИИ для узких, изолированных задач. Инвестиции сместятся в сторону разработки инструментов для интеграции данных, а не создания универсальных агентов.

📅 2026-01-23
Читать источник →

Связь ограничений ИИ и инвестиций в данные

Результаты бенчмарка APEX-Agents, показавшие неспособность ИИ работать с разрозненными данными, напрямую объясняют инвестиционный интерес к Mercor. Фонд Питера Тиля и другие инвесторы видят в создании качественных сред обучения (RL-окружений) решение главной проблемы отрасли. Вместо гонки за чипами, капитал течет в компании, способные научить ИИ синтезировать информацию.

Для бизнеса критически важно инвестировать не только в внедрение готовых моделей, но и в подготовку структурированных данных и создание собственных симуляций. Компании, игнорирующие качество данных и среды обучения, столкнутся с низкой эффективностью автоматизации.

Обновлено: 8 мая 2026

Календарь упоминаний:

2026
23 января

Прогресс ИИ в профессиональных задачах пока ограничен

Компания Mercor разработала бенчмарк APEX-Agents для оценки способности ИИ выполнять задачи высококвалифицированной офисной работы. Исследование показало, что даже современные модели, такие как Gemini 3 Flash и GPT-5.2, справляются с задачами лишь в 23–24% случаев. Основная сложность — необходимость синтеза данных из разных источников, что модели пока не умеют делать эффективно. Mercor подчеркивает, что реальная работа требует одновременного взаимодействия с несколькими платформами, а не получения информации в одном месте. Результаты указывают на ограниченный прогресс ИИ в автоматизации высокодоходных профессий.

Подробнее →

2025
28 декабря

Mercor становится новым игроком в мире ИИ-миллиардеров

Mercor — стартап, основанный 22-летним Brennan Foudy, Adarsh Hiremath и Sourya Midha, — вошёл в список компаний, создавших ИИ-миллиардеров в 2025 году. Компания принадлежит к числу молодых предпринимателей, чей бизнес связан с искусственным интеллектом, что стало ключевым фактором роста их благосостояния в условиях рекордного инвестиционного интереса к ИИ.

Подробнее →

17 ноября

Mercor как новый фокус стратегических инвестиций в ИИ

Фонд Thiel Macro Питера Тиля инвестировал в Mercor, стартап, разрабатывающий решения в области искусственного интеллекта. Это произошло в рамках перераспределения капитала из Nvidia в альтернативные активы на фоне опасений о перегреве сектора ИИ. Таким образом, Mercor оказался в числе компаний, привлекших внимание крупного инвестора как перспективное направление в этой сфере.

Подробнее →

30 сентября

Переход от рекрутинга к маркировке: путь Mercor

Mercor начал свою деятельность как стартап, разрабатывающий ИИ-рекрутера, но со временем сменил фокус и стал быстрорастущей компанией в сфере маркировки данных. Хотя сейчас Mercor не связан с рекрутингом, его история отражает динамику рынка ИИ, где стартапы часто меняют стратегию в зависимости от новых возможностей.

Подробнее →

22 сентября

Mercor развивает нишевые RL-окружения для сложных секторов

Mercor, компания с оценочной стоимостью более $10 млрд, специализируется на создании сред обучения с подкреплением (RL) для таких областей, как кодирование, здравоохранение и юриспруденция. В условиях роста спроса на RL-окружения, которые позволяют ИИ-агентам выполнять задачи в симулированных условиях, Mercor позиционирует себя как поставщик высококачественных решений в узкоспециализированных сферах.

Подробнее →


Mercor имеет 5 записей событий в нашей базе.
Объединили похожие карточки: Mercor; «Группа Mercor»; «Mercor Group» и другие.

Обратить внимание: