OpenAI вернулась к открытому коду выпустила новые ИИ‑модели

OpenAI впервые с 2019 года выпустила языковые модели с открытым исходным кодом. Новые нейросети gpt‑oss‑120b и gpt‑oss‑20b уже доступны для загрузки на Hugging Face и могут работать как на мощных GPU, так и на обычных ноутбуках.
gpt‑oss‑120b — самая производительная из двух моделей. По словам компании, она способна функционировать на одном графическом процессоре Nvidia, в то время как более лёгкая версия gpt‑oss‑20b рассчитана на запуск на устройствах с 16 ГБ оперативной памяти.
Обе модели созданы на архитектуре mixture‑of‑experts. Она позволяет задействовать лишь часть параметров при каждом запросе: так, gpt‑oss‑120b имеет 117 млрд параметров, но на токен работает только 5,1 млрд. Для посттренинга применялось обучение с подкреплением в симулированной среде.
В тестах новые модели показали достойные результаты. В соревновании по программированию Codeforces они обошли R1 от DeepSeek, но уступили закрытым версиям o3 и o4‑mini. На экзамене Humanity Last Exam gpt‑oss‑120b набрала 19%, gpt‑oss‑20b — 17,3%. Однако уязвимость к «галлюцинациям» остаётся высокой: в PersonQA они выдавали ошибки примерно в половине случаев.
OpenAI выпустила модели под лицензией Apache 2.0, что позволяет бизнесу использовать их без ограничений. Однако компания не раскрыла датасеты, на которых проходило обучение, сославшись на юридические риски. В прошлом организация откладывала релиз по соображениям безопасности, опасаясь применения технологий в кибератаках.
Amazon уже подтвердила, что gpt‑oss будет доступен на AWS. Microsoft представила версии, оптимизированные для Windows‑устройств. По мнению OpenAI, новые модели подойдут для создания ИИ‑агентов: они могут обращаться к веб‑поиску или запускать Python‑код.
Релиз совпал с сообщениями Financial Times о том, что OpenAI ведёт переговоры о продаже акций при оценке $500 млрд. Если сделка состоится, стартап обгонит SpaceX и станет самой дорогой частной технологической компанией в мире.