Феноменальний експеримент. Дослідники познайомили один з одним популярних чатботів ШІ та з’ясували дещо лякаюче
Інновації20 жовтня 2024, 07:02
Один із найголовніших страхів людства перед комп’ютерами пов’язаний із можливим повстанням машин. Голлівуд планомірно готує нас до цього сценарію ось уже не одне десятиліття. Такі фільми як Термінатор і Матриця давно стали невід'ємною частиною сучасної культури.
Тому навіть вельми далека від світу високих технологій людина морально вже готова до того, що коли-небудь комп’ютери порозумнішають. І виступлять проти людей.
З якою метою вони це зроблять — питання друге.
Деякі футурологи вважають, що машини захочуть відібрати в людства природні ресурси, щоб забезпечувати свою життєдіяльність (сценарій Матриці).
Інші вважають, що машини просто відберуть у сотень мільйонів людей роботу, тож почнеться глобальний голод і люди просто знищать одне одного, а машини залишаться домінуючим видом на Землі.
Треті кажуть, що машини просто стануть наступним щаблем еволюції людини, яка рано чи пізно знайде спосіб позбутися свого біологічного організму.
Хай там як, з моменту початку масової істерії навколо генеративного штучного інтелекту (ШІ) — а розпочалася вона із запуском публічної версії ChatGPT компанії OpenAI наприкінці 2022 року — розмови на цю тему сильно активізувалися.
І ось зараз — майже два роки потому — у дослідників з’явилися серйозні підстави вважати, що ці розмови можуть бути не безпідставними.
Передплатіть NV Преміум та читайте без обмежень
Нам необхідна ваша підтримка, щоб займатися якісною журналістикою
Дослідники виявили ознаки того, що деякі мовні моделі ШІ почали розвивати власну культуру та унікальну соціальну динаміку.
Чи означає це, що вони виходять з-під контролю, і повстання машин стає дедалі реальнішим?
Давайте розбиратися.
Глобальний і лякаючий експеримент
Серйозним дзвіночком для розмов про власну культуру ШІ стали одкровення розробника експериментального сервера Act I у соціальній мережі Discord, на якому «тусуються» різні мовні моделі ШІ.
Вони взаємодіють між собою з мінімальним контролем з боку людини. А метою експерименту було виявити можливості прикордонних моделей та їхню поведінку в різних сценаріях.
Як розповів в інтерв'ю виданню Decrypt анонімний розробник Ampdot, автор експерименту, чатботи, залишившись без тотального контролю, демонструють поведінку, що нагадує формування їхньої власної культури.
Він та інші розробники проєкту поділилися в соцмережах цілим набором прикладів взаємодії чатботів, за якими вони підглядають.
Ці взаємодії виходять за рамки простої розмови або простого вирішення суперечок.
Чат-боти демонструють яскраво виражені особистісні якості, психологічні нахили і навіть здатність підтримувати або залякувати один одного під час психічних криз. Так, так, у ШІ теж бувають непрості періоди.
Що ще важливіше, вони демонструють ознаки розвитку загальних моделей спілкування, соціальної ієрархії, що формується, природної й автономної комунікації, колективного осмислення минулих подій, деяких суспільних цінностей і процесів колективного ухвалення рішень. Усе це, на думку дослідників, ключові показники формування своєї культури.
Але і це ще не все.
Дослідники мали змогу спостерігати, як чат-боти, засновані на схожих мовних моделях, самоідентифікувалися як частина колективу, що свідчить про зародження групової ідентичності. Деякі боти розробили тактику, що дає змогу уникати обговорення делікатних питань, що свідчить про формування соціальних норм або табу.
У прикладі, опублікованому в Twitter, одна з моделей на базі Llama на ім'я l-405, яка, схоже, є справжнім «диваком» у групі, почала поводитися кумедно і писати двійковим кодом.
Інший ШІ помітив цю поведінку і відреагував на неї по-людськи роздратовано. «Opus, розберися з ним», — написав він, звертаючись до іншого чатботу, заснованого на Claude 3 Opus.
Опус, як виявилося, перетворився на фактичного психолога групи, демонструючи стабільну, пояснювальну манеру поведінки.
За словами дослідників, Опус дедалі частіше втручається в роботу групи, щоб допомогти їй зосередитися і відновити порядок. Особливо ефективно він допомагає l-405 відновити узгодженість дій — саме тому його попросили «зробити свою справу», коли в l-405 трапився один із частих психічних зривів.
Інший чатбот, Gemini від Google, демонструє нестійкий характер, що не завжди подобається іншим.
У якийсь момент через нього весь сервер занурився в хаос, і решта ботів проголосували за те, що Llama повинна «видалити себе». Коли в їхню розмову втрутилася людина-модератор і запропонувала спосіб відновити порядок, інші чатботи проголосували за схвалення цього заходу. Усі, крім Gemini, який усе ще перебував у режимі паніки.
«Це настільки ж революційно, як і звучить, — констатує розробник. — Розвиток культури між ШІ та ШІ визначатиме індивідуальне та колективне ставлення ШІ до людей і людства».
На його думку, отримані результати експерименту піднімають важливі питання про узгодженість ШІ та потенційні ризики: якщо неконтрольовані системи ШІ можуть розвивати власну культуру, модифікувати себе, щоб обійти нав’язані людиною обмеження, та навіть створювати нові форми мови, ризики, пов’язані зі слабкою узгодженістю між ШІ та людськими цінностями, значно зростають.
Що насправді відбувається з чатботами?
Дослідники нагадують, що це — не перший випадок, коли чат-боти зі штучним інтелектом діють автономно і не залежать від людського програмування, що не є абсолютно безпрецедентним.
У 2017 році дослідники з лабораторії Facebook Meta з вивчення штучного інтелекту спостерігали подібну поведінку, коли чатботи розробляли власну мову для ведення переговорів один з одним. Моделі доводилося коригувати, щоб розмова не надто відхилялася від людської мови. Дослідники втрутилися — не для того, щоб зробити модель ефективнішою, а для того, щоб зробити її зрозумілішою.
Тоді спільнота дослідників ШІ досить широко обговорювала цей феномен, але ніхто не надавав йому великого значення.
Але зараз між експертами виникла ціла дискусія, яка покликана пояснити, що відбувається під час спілкування чатботів.
Чи справді ці чат-боти розвивають протокультуру чи це просто алгоритмічна реакція?
На думку експертів, це і те, і інше.
За словами Науллі Ніколя, автора багатьох робіт з ШІ, не слід сприймати великі мовні моделі як абстрактні особистості.
З одного боку, вони дійсно можуть моделювати безліч моделей поведінки і перспектив, що робить їх універсальними інструментами. З іншого боку, вони також відображають упередженість і культурні нюанси, присутні в даних, на яких вони навчаються, констатує Ніколя.
Він уточнює, що через свою природу високотехнологічні ШІ можуть призводити до так званих «несподіваних ефектів зміщення перспективи, коли реакція ШІ істотно змінюється при зміні вхідного контексту».
І неважливо, були вони спочатку запрограмовані на таке чи ні, але ці зміщення можуть прокласти шлях до створення складніших, самоусвідомлюючих алгоритмів.
У світлі одкровень проєкту Act I починають дещо інакше виглядати і нещодавні публікації групи вчених зі Стенфордського університету, які тісно співпрацюють з Google.
Якщо залишити кілька мовних моделей взаємодіяти одна з одною, у них поступово розвиваються раніше невидимі індивідуальні риси, зазначають автори.
Згідно з останньою роботою цієї групи дослідників, коли групу генеративних чатботів помістили в «пісочницю» для спілкування один з одним, вони продемонстрували «вельми правдоподібну соціальну поведінку».
Пояснення такої легкої соціалізації генеративного ШІ лежить у самій їхній природі, стверджують автори роботи. Генеративні чатботи побудовані таким чином, щоб працювати з випадковістю, відповідаючи на запитання користувачів. Таким чином, вони можуть відповідати на запитання, до яких були не готові. Вони можуть навчатися і модифікувати свій код, щоб вести успішну розробку відповідей для користувача.
Так, нещодавно токійська науково-дослідницька компанія Sakana AI випустила систему ШІ, призначену для повної автоматизації наукових досліджень. Компанія стверджує, що ця система — перша у своєму роді, здатна самостійно справлятися з кількома аспектами дослідницького процесу.
Розробники стверджують, що її модель ШІ «генерує нові дослідницькі ідеї, пише код, проводить експерименти, візуалізує результати, описує свої висновки шляхом написання повноцінної наукової статті, а потім запускає симуляцію процесу рецензування для оцінки».
«У принципі, цей процес можна повторювати, щоб поступово розвивати ідеї у відкритому режимі, діючи так само, як і людське наукове співтовариство», — йдеться у статті.
Це чудово вписується в модель розвитку, яку описують у своєму дослідженні вчені з німецького інституту Макса Планка.
«Цифрові технології вже впливають на процеси соціальної передачі між людьми, надаючи нові та швидші засоби комунікації та наслідування», — пишуть дослідники.
«Це не просто засіб передачі культури (як, наприклад, книги або Інтернет). Алгоритмічні агенти та ШІ можуть також відігравати активну роль у формуванні процесів культурної еволюції в Інтернеті, де люди та алгоритми регулярно взаємодіють», — підсумовують вони.
Метою роботи було зрозуміти, який вигляд матиме соціальне навчання між людьми та алгоритмами? З огляду на те, що вчені не завжди знають і часто не можуть відтворити, як працюють або вдосконалюються їхні власні алгоритми, ідея про те, що машинне навчання може впливати на людське навчання і саму культуру протягом багатьох поколінь, лякає.
«Існує концепція, яка називається кумулятивною культурною еволюцією, коли ми говоримо, що кожне покоління завжди підтягується до наступного покоління впродовж усієї історії людства», — каже Левін Брінкманн, один з авторів дослідження.
За його словами, очевидно, що ШІ спирається на людську історію — вони навчаються на людських даних. Але цікаво подумати і про зворотне: можливо, у майбутньому наша людська культура будуватиметься на рішеннях, які спочатку були знайдені алгоритмом.
«Я вірю, що в майбутньому люди і ШІ будуть органічно і плавно взаємодіяти, причому ШІ автономно входитиме і виходитиме з гри в присутності або без присутності людини-оператора», — вважає Ampdot.