10 шкал DeepMind: измеряем автономность ИИ и отбираем реальные компании

Почти три года назад Google DeepMind опубликовала «Levels of AGI» – пять уровней и шесть степеней автономии. Выглядело убедительно, но проверка была невозможна: любой мог заявить, что его система на level 2, а оспорить это было почти как доказать существование единорога.

В марте 2026‑го появился документ «Measuring Progress Toward AGI». Вместо абстрактных названий – десять шкал, построенных на инструментах когнитивной психологии. Они покрывают восприятие, генерацию, рассуждение, внимание, обучение и две составные способности. Теперь модели можно сравнивать без личного вкуса.

Текущие бенчмарки уже запачканы: MMLU и HumanEval попали в обучающие корпуса, а тесты ChatGPT смешивают модель с промпт‑инженерией, калькуляторами и поисковиками. Новые шкалы чётко отделяют чистую память от навыка пользоваться инструментами – объективность наконец вошла в игру.

Для инвесторов это значит, что вместо обсуждения количества параметров можно смотреть на реальную автономию модели. Стандартизированный измеритель ускорит согласование с регуляторами и заставит аналитиков пересчитать стоимость компаний, у которых показатели по шкалам выше 7. Такие фирмы получат лёгкий доступ к капиталу и быстрее пройдут проверку надзорных органов.

Что делать CEO: требовать от AI‑подразделений отчёты по новым шкалам DeepMind, сопоставлять их с текущими KPI и перенаправлять ресурсы в проекты, демонстрирующие высокий уровень автономии. Это снизит риск переоценки, повысит доверие инвесторов и ускорит получение регуляторного одобрения.

Источник: Хабр: ИИ →

Оцените материал

★ ★ ★ ★ ★

ИИDeepMindAGIавтономностьтехнологии

10 шкал DeepMind: практический способ измерять автономность ИИ