Anthropic показал, что Claude умеет вести многодневные агентные воркфлоу без постоянного надзора. Модель получает задачу, сама переключается между тестовыми ораклами, постоянной памятью и оркестрационными паттернами, а недели рутинного программирования сжимаются до часов. За 2 000 сессий Claude собрал C‑компилятор, способный собрать ядро Linux; аналогичные эксперименты уже идут в научных проектах.
Самый яркий пример – дифференцируемая версия космологического болtzmann‑решателя на JAX. Такие решатели (CLASS, CAMB) обычно требуют месяцев работы над градиентными версиями. Claude Opus 4.6 написал рабочий код, автоматически дифференцирующий уравнения фотонов, барионов, нейтрино и тёмной материи на GPU, без участия эксперта‑космолога. Это доказывает, что даже задачи вне компетенции команды могут быть выполнены агентом при минимальном контроле.
Для компаний с R&D‑бюджетами в десятки миллионов такие автономные сценарии становятся экономически оправданными: миграция legacy‑кода, переписывание численных решателей и отладка масштабных научных проектов теперь можно «запустить» один раз и получить готовый артефакт за часы, а не годы. Инвестиционная стратегия меняется – вместо бесконечного расширения собственных кластеров имеет смысл рассматривать гибридные модели, где часть нагрузки берут облачные AI‑агенты.
Почему это важно? Пересчёт ROI R&D‑проектов с учётом экономии на HPC‑инфраструктуре уже показывает, что подписка на автономные AI‑агенты сокращает время разработки от месяцев до часов, ускоряя вывод продукта и повышая конкурентоспособность.