Китайская «супернейросеть» Goku для генерации видео шокировала мир

Китайская компания ByteDance, владеющая TikTok, совместно с Гонконгским университетом представила новую нейросеть Goku для генерации видео с помощью искусственного интеллекта. Модель, построенная на открытом исходном коде, уже рассматривается как потенциальный конкурент платформам Sora от OpenAI, Pika и Runway.
Goku использует передовую технологию Rectified Flow, обеспечивающую плавность и непрерывность движений. В отличие от традиционных моделей, которые корректируют отдельные кадры, Goku обрабатывает сразу целые последовательности, что делает видео более реалистичными. Система также способна синхронизировать движения с аудиофайлами, что открывает новые возможности для анимации и кинопроизводства.
Ключевым отличием Goku является открытая архитектура. Это позволяет разработчикам и компаниям не только использовать нейросеть, но и адаптировать ее под собственные нужды. Модель Goku+ предлагает еще более продвинутые функции, включая создание гиперреалистичных видео по текстовому описанию и интеграцию сложных визуальных эффектов.
Появление Goku отражает активное наступление Китая на рынок ИИ-технологий. В начале 2025 года стартап DeepSeek представил языковую модель DeepSeek-V3, способную конкурировать с ChatGPT, что вызвало резкое падение капитализации Nvidia на $600 млрд. Почти сразу за этим компания Alibaba выпустила свою нейросеть Qwen 2.5, заявив о её превосходстве над DeepSeek-V3.
Быстрые успехи Китая в ИИ-разработках подрывают доминирование западных технологий, демонстрируя не только техническое совершенство, но и высокую эффективность с точки зрения затрат. Так, разработка DeepSeek-V3 обошлась всего в $5,8 млн, что значительно меньше бюджетов западных компаний на аналогичные проекты.
Goku уже вызывает интерес у создателей контента, рекламных агентств и разработчиков ПО благодаря своей открытости и гибкости. Если модель оправдает ожидания, она может не только составить конкуренцию западным аналогам, но и задать новые стандарты в индустрии генеративного видео.