OpenAI powróciło do otwartego kodu i wypuściło nowe modele sztucznej inteligencji.

Po raz pierwszy od 2019 roku OpenAI wypuściło modele językowe z otwartym kodem źródłowym. Nowe sieci neuronowe gpt‑oss‑120b i gpt‑oss‑20b są już dostępne do pobrania na Hugging Face i mogą działać zarówno na wydajnych procesorach graficznych, jak i zwykłych laptopach.
gpt‑oss‑120b — najbardziej wydajny z dwóch modeli. Według firmy może działać na jednym procesorze graficznym Nvidia, podczas gdy lżejsza wersja gpt‑oss‑20b jest przeznaczona do uruchamiania na urządzeniach z 16 GB pamięci operacyjnej.
Oba modele zostały stworzone w oparciu o architekturę mixture‑of‑experts. Pozwala ona na wykorzystanie tylko części parametrów przy każdym zapytaniu: tak więc gpt‑oss‑120b ma 117 mld parametrów, ale na token działa tylko 5,1 mld. Do post-treningu zastosowano uczenie się ze wzmocnieniem w symulowanym środowisku.
W testach nowe modele pokazały dobre wyniki. W konkursie programistycznym Codeforces wyprzedziły R1 od DeepSeek, ale przegrały z zamkniętymi wersjami o3 i o4-mini. Na egzaminie Humanity Last Exam gpt‑oss‑120b uzyskał 19%, a gpt‑oss‑20b — 17,3%. Jednak podatność na „halucynacje” pozostaje wysoka: w PersonQA popełniały błędy w około połowie przypadków.
OpenAI wypuściło modele na licencji Apache 2.0, co pozwala firmom korzystać z nich bez ograniczeń. Jednak firma nie ujawniła zbiorów danych, na których odbywało się szkolenie, powołując się na ryzyko prawne. W przeszłości organizacja odkładała premierę ze względów bezpieczeństwa, obawiając się wykorzystania technologii w cyberatakach.
Amazon potwierdził już, że gpt‑oss będzie dostępny na AWS. Microsoft zaprezentował wersje zoptymalizowane pod kątem urządzeń z systemem Windows. Według OpenAI nowe modele będą odpowiednie do tworzenia agentów AI: mogą one korzystać z wyszukiwarki internetowej lub uruchamiać kod Python.
Wydanie zbiegło się z doniesieniami Financial Times, że OpenAI prowadzi negocjacje w sprawie sprzedaży akcji o wartości 500 mld dolarów. Jeśli transakcja dojdzie do skutku, startup wyprzedzi SpaceX i stanie się najdroższą prywatną firmą technologiczną na świecie.