Июнь 2026 | В фокусе

IBM представила фреймворк CUGA: внедрение ИИ-агентов за часы с встроенной безопасностью

IBM переносит сложность оркестрации агентных систем с разработчика на платформу, сокращая время создания прототипов с недель до часов. Встроенные в ядро политики безопасности и изоляция данных позволяют запускать ИИ в бизнес-процессах без риска утечек и галлюцинаций.

Содержание

Обзор

Архитектура и принцип работы

Библиотека приложений и инструменты

Управление безопасностью и политиками

Масштабирование и обучение

Операционные последствия и скрытые риски

Компания IBM представила открытый фреймворк CUGA (Configurable Generalist Agent) и библиотеку из 24 готовых приложений, демонстрирующих создание агентных систем в одном файле. Ключевое отличие решения — перенос сложности оркестрации, управления состоянием и планирования с разработчика на саму платформу, что позволяет писать код только для инструментов и промптов. Архитектура изначально спроектирована для корпоративного использования: политики безопасности и изоляция данных встроены в ядро, а не добавляются постфактум. Это меняет подход к внедрению ИИ в бизнес-процессы, сокращая время от идеи до рабочего прототипа с недель до часов.

Архитектура и принцип работы

Вместо того чтобы писать сложный код для связки модели, инструментов и интерфейса, разработчик использует готовый «каркас». CUGA берет на себя планирование действий, выполнение циклов и сохранение промежуточных результатов. Это решает частую проблему агентных систем — потерю контекста на длинных задачах.

Платформа работает по принципу «настрой, а не строй». Разработчик определяет список доступных инструментов и дает инструкции, а остальное обрабатывает ядро:

Управление состоянием: Система запоминает промежуточные результаты и не пересчитывает их заново, если план меняется.
Рефлексия: Если действие не сработало, агент сам анализирует ошибку и перестраивает план, вместо того чтобы продолжать выполнение с ошибкой.
Гибкость моделей: Через переменную окружения можно переключаться между провайдерами (OpenAI, Anthropic, watsonx, Ollama) без изменения кода приложения.
Режимы работы: Настройка баланса между скоростью и точностью через конфигурацию (Fast, Balanced, Accurate).

Важный нюанс: Использование более компактных открытых моделей (например, gpt-oss-120b) становится возможным благодаря тому, что сложная логика планирования и контроля ложится на фреймворк, а не на саму языковую модель.

Библиотека приложений и инструменты

Для демонстрации возможностей создано 24 приложения, каждое из которых укладывается в один файл FastAPI. Они покрывают различные сценарии: от рекомендации фильмов до консультирования по архитектуре облака IBM Cloud.

Приложения используют гибридный подход к инструментам:

Встроенные инструменты: Специфические функции, написанные разработчиком (например, поиск по каталогу услуг).
MCP-серверы: Готовые публичные серверы с общими возможностями (поиск в вебе, работа с документами, геокодирование, финансовые данные), которые подключаются без необходимости их хостинга.

Такой подход позволяет собирать сложные системы из готовых блоков. Например, приложение-консультант по облаку проверяет существование сервиса в каталоге перед тем, как дать рекомендацию, что исключает галлюцинации.

Управление безопасностью и политиками

В отличие от многих решений, где безопасность накладывается поверх готового агента, в CUGA система политик встроена в рантайм. Это позволяет управлять поведением агента на разных этапах его работы:

Intent Guard: Блокирует запросы, содержащие запрещенные действия (например, принудительную отправку кода), еще до начала планирования.
Tool Approval: Требует подтверждения человека перед запуском опасных инструментов.
Tool Guide: Диктует правила использования конкретного инструмента.
Playbook: Фиксирует проверенные сценарии для повторяющихся задач.
Output Formatter: Принудительно форматирует итоговый ответ под нужный стандарт.

Политики хранятся в папке .cuga вместе с кодом, что обеспечивает версионирование и контроль изменений. Срабатывание политик основано не только на точном совпадении слов, но и на семантическом анализе запроса.

Стоит учесть: Безопасность здесь не является опцией, которую можно забыть включить. По умолчанию агент работает в режиме с контролем, а «свободный» режим требует явного выбора разработчика.

Масштабирование и обучение

Когда задача становится слишком сложной для одного агента, архитектура позволяет разбить её на подзадачи с помощью супервизора (CugaSupervisor). Он распределяет работу между узкоспециализированными агентами, каждый из которых имеет свой контекст и набор инструментов. Это предотвращает перегрузку контекстного окна и изолирует сбои: падение одного специализированного агента не ломает весь процесс.

Кроме того, реализована система ALTK-Evolve, позволяющая агенту обучаться на собственном опыте. Успешные сценарии сохраняются в файлы навыков (SKILL.md), которые загружаются в контекст при повторном выполнении похожих задач. Это снижает необходимость в постоянном ручном редактировании промптов.

Операционные последствия и скрытые риски

На основе изложенных фактов можно выделить ключевые моменты для внедрения:

Снижение порога входа: Возможность создать рабочее приложение в одном файле позволяет быстро тестировать гипотезы без глубоких знаний архитектуры микросервисов.
Зависимость от инфраструктуры: Для работы некоторых функций (например, автоматизации браузера через Playwright) требуется наличие Docker и корректно настроенных зависимостей, что может усложнить развертывание в ограниченных средах.
Гибкость выбора модели: Возможность легко переключаться на локальные модели (Ollama) снижает затраты на API-вызовы, но требует наличия собственных вычислительных мощностей.
Изоляция данных: Архитектура Sovereign Core обеспечивает полную изоляцию данных и управления внутри контура заказчика, что критично для соблюдения требований к защите информации в госсекторе и крупном бизнесе.
Сложность отладки: При использовании семантического поиска для политик может возникнуть сложность в предсказании срабатывания блокировок при изменении формулировок запросов пользователя.

На фоне этого: Переход от «черного ящика» к открытому коду позволяет компаниям самостоятельно проверять логику принятия решений агентом, что повышает доверие к автоматизации критических бизнес-процессов.

Контакты Асектор ✉

Коротко о главном

Как CUGA решает проблему потери контекста в длинных задачах?

Система автоматически сохраняет промежуточные результаты и не пересчитывает их при изменении плана, а также самостоятельно анализирует ошибки и перестраивает стратегию выполнения.

Почему использование компактных моделей, таких как gpt-oss-120b, стало возможным?

Сложная логика планирования и контроля вынесена в фреймворк, что снижает требования к интеллекту самой языковой модели и позволяет эффективно работать с меньшими архитектурами.

Как архитектура CUGA исключает галлюцинации при генерации рекомендаций?

Приложения используют гибридный подход, проверяя существование сервисов через встроенные инструменты и MCP-серверы перед выдачей ответа пользователю.

В чем заключается принцип встроенной безопасности в ядре платформы?

Политики, такие как Intent Guard и Tool Approval, блокируют запрещенные действия и требуют подтверждения человека до начала выполнения, предотвращая запуск опасных инструментов.

Как система CugaSupervisor обрабатывает задачи, превышающие возможности одного агента?

Супервизор распределяет работу между узкоспециализированными агентами, изолируя сбои отдельных узлов и предотвращая перегрузку контекстного окна.

Каким образом агент обучается на собственном опыте без ручного редактирования промптов?

Успешные сценарии сохраняются в файлы навыков SKILL.md через систему ALTK-Evolve и автоматически загружаются в контекст при повторном выполнении похожих задач.

Какие требования к инфраструктуре могут усложнить развертывание CUGA?

Для работы функций автоматизации браузера через Playwright необходимо наличие Docker и корректно настроенных зависимостей, что создает ограничения в средах с жесткими требованиями.