Традиционная фармацевтика столкнулась со «структурным барьером». Десятилетиями индустрия полагалась на дизайн лекарств на основе структуры (SBDD) — редукционистский подход «ключ-замок», требующий сверхточных 3D-моделей белков. Однако, как отмечают Цзыюй Сюй и Цзыцзянь Чжан из Китайской академии наук, эта парадигма буксует, когда речь заходит о неупорядоченных белках или сложных системных заболеваниях, где патология — это сбой в работе целой сети биологических путей, а не одна конкретная мишень.
Чтобы преодолеть этот тупик, исследователи формализовали концепцию дизайна лекарств на основе транскриптома (TBDD). Это генеративная обратная задача: мы проектируем молекулу, исходя из желаемого изменения состояния клетки. Вместо поиска ключа к конкретному замку вы задаете необходимый результат, а искусственный интеллект конструирует химическую структуру, способную его вызвать.
Главным инструментом в этом процессе выступает CURE (CellUlar Response Engine) — диффузионный фреймворк, призванный сократить дистанцию между биологическими сигналами и химическим синтезом. В работе, опубликованной на arXiv, команда признает: проектирование лекарств на базе транскриптомных данных — задача «плохо поставленная». Биологические сигналы разрежены, а клеточная среда перенасыщена шумом. Для стабилизации процесса в CURE внедрили экстрактор признаков TFE, который дистиллирует функциональные эмбеддинги из состояний клетки «до» и «после» воздействия. Благодаря агрегации данных с учетом их гетерогенности, CURE выделяет чистый сигнал там, где предыдущие модели вроде GexMolGen или TRIOMPHE оказывались бессильны.
Тесты на стандартных бенчмарках и протоколах Out-of-Distribution подтверждают эффективность методологии «диффузии с условием на пертурбацию». В задаче zero-shot дизайна ингибиторов генов CURE сумел сгенерировать молекулы для мишеней, которые отсутствовали в обучающей выборке. Для R&D-директоров это мощный операционный рычаг: появляется возможность масштабировать разработку препаратов для фенотипических заболеваний, где классическое моделирование белков неэффективно. На текущем этапе потенциал CURE ограничен лишь необходимостью лабораторной валидации синтезированных соединений — вопрос подтверждения в «мокрой» лаборатории остается открытым.
Мы наблюдаем фундаментальный сдвиг: от предсказания свойств молекулы к предписанию того, какой она должна быть. Фреймворк CURE фактически рассматривает клетку как операционную систему, позволяя сначала написать код желаемого вывода, а затем под него собрать «железо» — саму молекулу. Для бизнеса в сфере фармтеха это означает, что отсутствие данных о структуре белка больше не является поводом для закрытия проекта, если в распоряжении есть качественные транскриптомные данные о состоянии болезни.