Google представила ИИ-модель для управления роботами без подключения к интернету

Google DeepMind представила языково-визуально-действенную модель нового поколения — Gemini Robotics On-Device, способную управлять роботами без подключения к интернету. По словам разработчиков, это первый Vision-Language-Action (VLA) ИИ, объединяющий восприятие, понимание инструкций и выполнение действий в едином локальном процессе.

Новая модель расширяет возможности предыдущей версии Gemini Robotics, выпущенной в марте. Она может управлять двухрукими роботами, выполнять сложные манипуляции и адаптироваться к незнакомым объектам и средам без необходимости удалённого доступа. Среди демонстрируемых сценариев — распаковка сумок, складывание одежды и сборка компонентов на производственной линии.

По словам Сергея Лоншакова, архитектора проекта «Робономика», такой подход соответствует текущему тренду в робототехнике на создание бесшовных (seamless) моделей, в которых планирование и выполнение задач происходят в реальном времени. Это избавляет от пауз при переключении задач и повышает автономность систем.

Gemini Robotics On-Device была протестирована на роботах ALOHA, Franka FR3 и гуманоиде Apollo от Apptronik. Для адаптации к новым задачам достаточно 50–100 демонстраций, а для настройки модели доступен специальный SDK с поддержкой симулятора MuJoCo. Разработчики могут использовать промпты на естественном языке для обучения и тестирования.

Интерес к автономной робототехнике быстро растёт. В марте Nvidia представила платформу для моделирования движений гуманоидов, а в июне стало известно, что Amazon тестирует собственный ИИ для доставки посылок с помощью роботов в электрофургонах Rivian.

Разработка DeepMind делает шаг к созданию более автономных, универсальных и адаптивных роботов, способных действовать в реальном мире без постоянной поддержки облака.

Была ли интересной эта новость?

👍
0
👎
0