ChatGPT научили выполнять сложные задачи вместо человека

OpenAI представила нового ИИ-агента для ChatGPT, способного выполнять широкий спектр цифровых задач. Пользователи могут общаться с ним на естественном языке, а сам инструмент автоматически управляет календарями, создает слайды, анализирует конкурентов и даже совершает покупки. Изначально он доступен подписчикам тарифов Pro, Plus и Team в рамках функции agent mode.

Новая разработка совмещает возможности нескольких предыдущих решений от OpenAI. В частности, агент может кликать по сайтам, собирать и обобщать информацию с десятков источников, запускать код, подключаться к сервисам вроде Gmail, GitHub и использовать API. У него также есть доступ к терминалу и ChatGPT connectors.

В демонстрации агент справился с планированием японского завтрака, анализом конкурентов и подготовкой презентации. OpenAI подчеркивает, что модель превзошла все предыдущие версии в ряде бенчмарков. Так, в тесте Humanity’s Last Exam агент показал результат 41,6%, а в математическом тесте FrontierMath — 27,4%, что в несколько раз выше прошлых рекордов.

Особое внимание компания уделила вопросам безопасности. Поскольку агент имеет доступ к внешним сервисам и способен генерировать код, предусмотрена защита от потенциальных злоупотреблений. Все запросы проходят проверку, особенно в чувствительных областях, таких как биология и химия. Кроме того, в этом режиме отключена функция памяти.

В отчете OpenAI модель отнесена к категории с высоким риском в сфере био- и химоружия. Хотя прямых доказательств угрозы нет, компания применяет превентивные меры. Это связано с общими усилиями OpenAI по защите интеллектуальной собственности и предотвращению утечек данных, включая шпионаж со стороны конкурентов.

Была ли интересной эта новость?

👍
0
👎
0