Почти три года назад Google DeepMind опубликовала «Levels of AGI» – пять уровней и шесть степеней автономии. Выглядело убедительно, но проверка была невозможна: любой мог заявить, что его система на level 2, а оспорить это было почти как доказать существование единорога.
В марте 2026‑го появился документ «Measuring Progress Toward AGI». Вместо абстрактных названий – десять шкал, построенных на инструментах когнитивной психологии. Они покрывают восприятие, генерацию, рассуждение, внимание, обучение и две составные способности. Теперь модели можно сравнивать без личного вкуса.
Текущие бенчмарки уже запачканы: MMLU и HumanEval попали в обучающие корпуса, а тесты ChatGPT смешивают модель с промпт‑инженерией, калькуляторами и поисковиками. Новые шкалы чётко отделяют чистую память от навыка пользоваться инструментами – объективность наконец вошла в игру.
Для инвесторов это значит, что вместо обсуждения количества параметров можно смотреть на реальную автономию модели. Стандартизированный измеритель ускорит согласование с регуляторами и заставит аналитиков пересчитать стоимость компаний, у которых показатели по шкалам выше 7. Такие фирмы получат лёгкий доступ к капиталу и быстрее пройдут проверку надзорных органов.
Что делать CEO: требовать от AI‑подразделений отчёты по новым шкалам DeepMind, сопоставлять их с текущими KPI и перенаправлять ресурсы в проекты, демонстрирующие высокий уровень автономии. Это снизит риск переоценки, повысит доверие инвесторов и ускорит получение регуляторного одобрения.