IBM разместил Configurable Generalist Agent (CUGA) на Hugging Face Spaces – это уже не «прототип», а полностью собранный набор многошаговых агентов, который можно запустить без собственного ML‑отдела. По публичным тестам CUGA занял первое место в бенчмарке AppWorld (750 задач, 457 API) и второе в WebArena, где проверяют автономную работу в вебе.
Технически фреймворк построен по схеме «планировщик‑исполнитель», дополненной код‑активатором и управляемой схемой переменных. Такой подход подавляет типичные «галлюцинации» моделей, позволяя оркестрировать процесс от планирования до UI и API через OpenAPI, MCP‑серверы или LangChain. Для бизнес‑пользователей предусмотрен визуальный конструктор на базе Langflow – низкокодовый редактор, где цепочку действий собирают перетаскиванием блоков.
Пример из практики: в HR CUGA автоматизирует поиск кандидатов, скрейпинг публичных профилей и генерацию приглашений; в клиентской поддержке агент одновременно ведёт диалог, вызывает API биллинга и открывает UI‑элементы браузера. IBM заявляет, что такие сценарии сокращают вывод продукта с месяцев до недель и экономят до 40 % расходов на разработку, потому что не нужна отдельная ML‑команда.
Почему это важно для тебя, CEO? CUGA превращает создание интеллектуальных агентов из нишевого эксперимента в почти готовый продукт. Если у компании уже есть REST/OpenAPI‑инфраструктура, ты можешь запустить пилотный проект в HR или поддержке за пару недель, измерить экономию и решить, стоит ли масштабировать. Это реальный способ проверить AI‑инициативу без крупных инвестиций в исследовательские команды.