AI2 не перестает удивлять. На этот раз — MolmoWeb. Первый в мире полностью открытый веб-агент, который управляет сайтами, опираясь только на то, что видит — скриншоты. Ему не нужен доступ к вашему драгоценному HTML. Просто смотрите, кликайте, вводите данные — всё как у человека, только без лишней возни с кодом. Пока конкуренты штампуют свои непрозрачные 'черные ящики', AI2 подкидывает рынку открытый инструмент. Иронично, не правда ли?
Главное здесь — эффективность. Модели MolmoWeb на 4 и 8 миллиардов параметров уделали многих открытых конкурентов, а вплотную подобрались к проприетарным решениям от OpenAI. Впечатляющий результат, который доказывает: гигантские размеры — не всегда признак ума. Продуманная архитектура и качественные данные куда важнее. Плюс, вся эта открытость — от весов моделей до инструментов — снимает головную боль у разработчиков и исследователей, подстегивая развитие визуальных AI-агентов.
Не обошлось и без солидного датасета — MolmoWebMix, собранный из 36 тысяч реальных пользовательских сессий. Добавили немного синтетики — и вуаля. Модель обучена без дорогих изысков вроде обучения с подкреплением и без кражи секретов из закрытых систем. Все компоненты — от языковой модели Qwen3 до SigLIP2 для изображений — в открытом доступе. Делайте что хотите, дорабатывайте, экспериментируйте.
Зачем вам это знать? А вот зачем: MolmoWeb радикально удешевляет и упрощает автоматизацию браузерных задач. Забудьте о дорогих лицензиях и сложной интеграции. У вас в руках мощный инструмент, который превращает UI-тестирование, клиентскую поддержку и сбор данных из кошмара в рутину. И всё это — на расстоянии одного клика, а не месячного бюджета.