OpenAI przedstawiło flagowy model GPT-5

OpenAI uruchomiło nowy flagowy model sztucznej inteligencji GPT-5, który stanie się rdzeniem następnej generacji produktów ChatGPT i API firmy. Jest to pierwsza sieć neuronowa firmy, która potrafi dynamicznie wybierać między trybami szybkiej odpowiedzi a dogłębnym przetwarzaniem zadania, w zależności od zapytania użytkownika.

Model GPT-5 znacznie przewyższa poprzednią wersję pod względem wielu wskaźników. Na przykład w teście SWE-bench Verified, oceniającym umiejętności programowania, GPT-5 uzyskał 74,9% za pierwszym podejściem — więcej niż Claude Opus 4.1 i Gemini 2.5 Pro. W zadaniach na poziomie doktoranckim z GPQA Diamond uzyskała wynik 89,4%, stając się liderem wśród porównywalnych modeli. Poziom „halucynacji” w GPT-5 wynosi zaledwie 4,8%, czyli 4–5 razy mniej niż w przypadku GPT-4o i o3.

OpenAI zauważa również poprawę w bardziej subiektywnych obszarach — kreatywnym pisaniu, projektowaniu, generowaniu kodu dla edukacyjnych aplikacji internetowych. Przykłady obejmują tworzenie symulatorów i wizualnych wyjaśnień złożonych koncepcji naukowych. GPT-5 może wykonywać zadania w imieniu użytkownika, takie jak planowanie harmonogramu lub generowanie materiałów badawczych.

W bezpłatnej wersji ChatGPT model jest dostępny z ograniczeniami, ale użytkownicy taryf Plus i Pro otrzymują zwiększone limity. Za pośrednictwem API dostępne są trzy wersje modelu — GPT-5, GPT-5 mini i nano — z możliwością integracji z usługami zewnętrznymi.

Chociaż GPT-5 osiągnął znakomite wyniki w zakresie dokładności, kreatywności i projektowania, w niektórych zadaniach nadal ustępuje konkurentom. Na przykład w Tau-bench model wykazał jedynie porównywalne wyniki w symulacji działań online, a w zadaniach związanych z nawigacją w e-commerce ustąpił Claude Opus 4.1.

Sam Altman nazwał uruchomienie GPT-5 „znaczącym krokiem w kierunku sztucznej inteligencji ogólnej”. Firma twierdzi, że nowy model jest nie tylko bardziej wydajny i bezpieczny, ale także skuteczniej wykrywa szkodliwe zapytania.

Czy ta wiadomość była interesująca?

👍
0
👎
0