ChatGPT навчили виконувати складні завдання замість людини

OpenAI представила нового ШІ-агента для ChatGPT, здатного виконувати широкий спектр цифрових завдань. Користувачі можуть спілкуватися з ним природною мовою, а сам інструмент автоматично керує календарями, створює слайди, аналізує конкурентів і навіть здійснює покупки. Спочатку він доступний передплатникам тарифів Pro, Plus і Team у рамках функції agent mode.

Нова розробка поєднує можливості кількох попередніх рішень від OpenAI. Зокрема, агент може клікати сайтами, збирати й узагальнювати інформацію з десятків джерел, запускати код, підключатися до сервісів на кшталт Gmail, GitHub і використовувати API. У нього також є доступ до терміналу і ChatGPT connectors.

У демонстрації агент впорався з плануванням японського сніданку, аналізом конкурентів і підготовкою презентації. OpenAI підкреслює, що модель перевершила всі попередні версії в низці бенчмарків. Так, у тесті Humanity’s Last Exam агент показав результат 41,6%, а в математичному тесті FrontierMath – 27,4%, що в кілька разів вище минулих рекордів.

Особливу увагу компанія приділила питанням безпеки. Оскільки агент має доступ до зовнішніх сервісів і здатний генерувати код, передбачено захист від потенційних зловживань. Усі запити проходять перевірку, особливо в чутливих галузях, таких як біологія та хімія. Крім того, в цьому режимі вимкнено функцію пам’яті.

У звіті OpenAI модель віднесено до категорії з високим ризиком у сфері біо- та хімзброї. Хоча прямих доказів загрози немає, компанія застосовує превентивні заходи. Це пов’язано із загальними зусиллями OpenAI щодо захисту інтелектуальної власності та запобігання витокам даних, включно зі шпигунством з боку конкурентів.

Чи була цікавою ця новина?

👍
0
👎
0