Alibaba випустила «вбивцю» OpenAI та Gemini — ШІ-моделі з гібридним мисленням

Alibaba випустила нове покоління мовних моделей під назвою Qwen3, що охоплює широкий діапазон параметрів і завдань. За заявами компанії, моделі в деяких тестах демонструють продуктивність на рівні або вищу за системи від OpenAI та Google. Основний акцент зроблено на “гібридному” мисленні — здатності перемикатися між глибоким міркуванням і швидкими відповідями.

Найбільша модель Qwen-3-235B-A22B не є загальнодоступною, але вже перевершила o3-mini та Gemini 2.5 Pro у складних математичних і логічних тестах. Серед відкритих версій найпотужніша – Qwen3-32B – також показує конкурентні результати, включно з перевагою над моделлю o1 від OpenAI у низці кодингових завдань.

Alibaba стверджує, що ключові відмінності Qwen3 включають поліпшену роботу з інструментами, дотримання інструкцій і форматування даних. Деякі версії використовують архітектуру MoE, що підвищує обчислювальну ефективність шляхом розподілу завдань між “експертами”. Моделі доступні через GitHub, Hugging Face і хмарні платформи.

Компанія навчила Qwen3 на масивному корпусі з 36 трильйонів токенів, включно з навчальними матеріалами, кодом, штучно згенерованими даними та парами запитань і відповідей. Це дало істотне поліпшення порівняно з попередньою версією Qwen2. Нові моделі підтримують 119 мов і призначені для широкого кола завдань.

Експерти вважають запуск Qwen3 підтвердженням зростання китайського ШІ-сектору та посилення конкуренції із західними лабораторіями. В умовах обмежень на постачання чипів до Китаю, відкриті моделі на кшталт Qwen3 стануть важливим елементом технологічної автономії. Qwen3 вже застосовується в низці комерційних сервісів.

Чи була цікавою ця новина?

👍
0
👎
0

Завантажити застосунок Trustee Plus та випустити криптокарту