OpenAI приблизилась к запуску ИИ-агента

open ai new logo inc 545203 beco8q

Программист Тибор Блахо, известный точными инсайдами о будущих ИИ-продуктах, обнаружил доказательства существования у OpenAI некоего агента под кодовым именем «Оператор».

По словам Блахо, в десктопной версии ChatGPT для macOS присутствуют скрытые функции для включения и отключения «Оператора». Пользователь X под ником M1 сообщил об аналогичных деталях.

Блахо также наткнулся на упоминания этого ИИ-агента на официальном сайте OpenAI и сравнение с конкурентными решениями.

Упомянутая таблица указывает, что «Оператор» пока не очень надежен в ряде задач. В бенчмарке OSWorld, моделирующем реальную компьютерную среду, нейросеть от OpenAI набирает 38,1%, обгоняя решение Anthropic, но заметно отставая от человеческого результата в 72,4%. В то же время в WebVoyager, оценивающем способность искусственного интеллекта к навигации на веб-сайтах, «Оператор» превосходит показатели человека.

Успешность в задаче по созданию биткоин-кошелька составила 10%, а при регистрации у облачного провайдера — 60%.

Утекшие в сеть графики показывают, что ИИ-агент демонстрирует высокие показатели в сфере безопасности, противостоя незаконным действиям и попыткам получить «чувствительные личные данные.»

Контекст

  • В ноябре появились сведения, что OpenAI готовит к запуску собственного ИИ-агента под названием «Оператор.»