Команда Anthropic навчила ШІ керувати вашим комп’ютером за допомогою чат-бота Claude 3.5 Sonnet
ШІ-стартап Anthropic представив оновлену версію свого чат-бота — Claude 3.5 Sonnet. Тепер він здатний працювати на комп’ютері немов жива людина. Модель може переміщати курсор, натискати на кнопки і навіть вводити текст, що відкриває нові можливості для автоматизації.
В Anthropic підкреслили, що замість створення спеціалізованих інструментів, вони навчили Claude загальних комп’ютерних навичок. Це дає змогу використовувати вже наявні програми та рішення, розроблені для людей, щоб автоматизувати різні завдання, як-от тестування ПЗ і виконання повторюваних процесів.
Для розробників було створено API, який дає змогу моделі сприймати комп’ютерні інтерфейси та взаємодіяти з ними. Однак компанія попередила, що функція перебуває на стадії експерименту, тому можливі помилки. Тестування вже почали такі компанії, як Asana, Canva, Cognition, DoorDash, Replit і The Browser Company.
Незважаючи на новаторські можливості, Claude стикається з певними складнощами під час виконання завдань, які здаються людям простими. До таких операцій можна віднести прокручування сторінок, масштабування або перетягування об’єктів.
В Anthropic також заявили про поліпшення моделі в галузі програмування. Зокрема, експерти зазначили, що ШІ став краще справлятися з багатоетапними процесами розробки. На їхню думку, це робить його «ідеальним вибором» для таких завдань. Хороші відгуки надійшли також від компаній Cognition і The Browser Company.
Модель Claude 3.5 Haiku теж показує сильні результати в програмуванні, набравши 40,6% на тесті SWE-bench Verified і випередивши багатьох конкурентів.
Варто зазначити, що в жовтні модель GPT-4o від OpenAI посіла перше місце в рейтингу з програмування мовою Solidity. Вона залишила позаду інші ШІ-рішення, зокрема o1-preview і o1-mini.