OpenAI повернулася до відкритого коду та випустила нові ШІ-моделі

OpenAI вперше з 2019 року випустила мовні моделі з відкритим вихідним кодом. Нові нейромережі gpt‑oss‑120b і gpt‑oss‑20b вже доступні для завантаження на Hugging Face і можуть працювати як на потужних GPU, так і на звичайних ноутбуках.

gpt‑oss‑120b — найпродуктивніша з двох моделей. За словами компанії, вона здатна функціонувати на одному графічному процесорі Nvidia, тоді як легша версія gpt‑oss‑20b розрахована на запуск на пристроях з 16 ГБ оперативної пам’яті.

Обидві моделі створені на архітектурі mixture‑of‑experts. Вона дозволяє задіяти лише частину параметрів при кожному запиті: так, gpt‑oss‑120b має 117 млрд параметрів, але на токен працює тільки 5,1 млрд. Для посттренінгу застосовувалося навчання з підкріпленням в симульованому середовищі.

У тестах нові моделі показали гідні результати. У змаганні з програмування Codeforces вони обійшли R1 від DeepSeek, але поступилися закритим версіям o3 і o4‑mini. На іспиті Humanity Last Exam gpt‑oss‑120b набрала 19%, gpt‑oss‑20b — 17,3%. Однак вразливість до «галюцинацій» залишається високою: в PersonQA вони видавали помилки приблизно в половині випадків.

OpenAI випустила моделі під ліцензією Apache 2.0, що дозволяє бізнесу використовувати їх без обмежень. Однак компанія не розкрила набори даних, на яких проходило навчання, пославшись на юридичні ризики. У минулому організація відкладала реліз з міркувань безпеки, побоюючись застосування технологій у кібератаках.

Amazon вже підтвердила, що gpt‑oss буде доступний на AWS. Microsoft представила версії, оптимізовані для Windows‑пристроїв. На думку OpenAI, нові моделі підійдуть для створення ШІ‑агентів: вони можуть звертатися до веб‑пошуку або запускати Python‑код.

Реліз збігся з повідомленнями Financial Times про те, що OpenAI веде переговори про продаж акцій за оцінкою $500 млрд. Якщо угода відбудеться, стартап випередить SpaceX і стане найдорожчою приватною технологічною компанією в світі.

Чи була цікавою ця новина?

👍
0
👎
0