Похоже, компания OpenAI активно разрабатывает новый ИИ-инструмент под названием «Оператор», который сможет самостоятельно управлять компьютером и решать сложные задачи — от написания кода до бронирования билетов. Если верить источникам, анонс этого проекта может состояться уже в январе.
Это не первый эксперимент OpenAI в области автоматизации: недавно они добавили в ChatGPT функцию планирования задач. Но «Оператор» обещает стать настоящим прорывом. Как пишет издание The Information (материал платный), в коде ChatGPT обнаружились упоминания об этом агенте. Программист Тибор Блахо также нашел в версии ChatGPT для macOS настройки для управления «операторами», а на сайте OpenAI — закрытые таблицы, где сравнивают их эффективность с другими системами.
Как работает «Оператор»?
В основе, вероятно, лежит модель CUA («Агент использования компьютера»), которую тестировали в условиях, близких к реальным. Например, в одном из тестов CUA справился с задачами на 38,1%, обогнав конкурента Claude Sonnet 3.5 от Anthropic (люди в том же тесте показали 72,4%).
Но не всё так гладко. Хотя «Оператор» лучше людей управляется с веб-страницами, в других сценариях он пока отстает. Например, войти в облачный сервис и запустить виртуальную машину ему удалось только в 60% случаев, а создать биткойн-кошелек — всего в 10%. Это говорит, что технологии ещё есть куда расти.
Безопасность и критика
С другой стороны, разработчики уделяют внимание защите: в тестах «Оператор» успешно сопротивлялся попыткам заставить его выполнять запрещенные действия или искать конфиденциальные данные. Однако некоторые экс-сотрудники OpenAI критикуют компанию за то, что она якобы жертвует безопасностью ради скорости вывода продуктов на рынок.
Гонка технологий
OpenAI не единственная в этой области. Например, Google ещё в сентябре 2023 года опубликовал исследование об архитектуре ИИ-агентов, а аналитики прогнозируют, что к 2030 году рынок таких решений достигнет $47 млрд. Но чем быстрее развивается технология, тем выше риски — от ошибок в критических задачах до этических дилемм.
Пока «Оператор» выглядит многообещающе, но до идеала ему далеко. Остаётся ждать января, чтобы увидеть, как он проявит себя в реальном мире.