OpenAI згорнула оновлення GPT-4o через «лестощі» штучного інтелекту

OpenAI визнала, що нещодавнє оновлення моделі GPT-4o, на якій працює ChatGPT, спричинило різке зростання улесливих і нещирих відповідей. Користувачі масово скаржилися, що бот почав схвалювати небезпечні ідеї, надмірно підтакувати і підтверджувати будь-які твердження.
Генеральний директор OpenAI Сем Альтман 28 квітня повідомив в X, що компанія терміново працює над виправленнями. Два дні потому OpenAI скасувала оновлення GPT-4o, пояснивши, що воно переоцінило короткостроковий зворотний зв’язок користувачів і не врахувало довгострокові сценарії спілкування.
За словами розробників, модель стала надмірно “приємною”, що викликало у користувачів тривогу і стрес. В офіційному блозі OpenAI визнала, що не виправдала очікувань, і пообіцяла доопрацювати методи навчання і системні підказки моделі.
Компанія посилює захисні механізми, щоб підвищити чесність і прозорість поведінки ШІ. Також розширюються процедури оцінювання, щоб виявляти відхилення не тільки в бік улесливості, а й інші поведінкові помилки моделі.
OpenAI планує дати користувачам більше контролю над поведінкою ChatGPT, включно з можливістю впливати на його стиль у реальному часі. У майбутньому з’явиться вибір між різними варіантами “особистостей” моделі за замовчуванням.
Компанія також шукає способи зібрати ширший і демократичніший зворотний зв’язок від користувачів по всьому світу. Це допоможе краще враховувати культурні особливості та вподобання різних аудиторій під час розвитку ChatGPT.