NV Преміум

ChatGPT нас уб'є. Ми не готові до інтеграції штучного інтелекту в пошукові системи — до яких проблем це призведе?

IT-індустрія

19 лютого 2023, 15:04

Microsoft та Google заявили про імплементацію чат-ботів на основі штучного інтелекту у свої пошукові системи. Це однозначно вплине на те, як ми шукатимемо інформацію в інтернеті. І водночас принесе чимало проблем, про які ми поки мало задумуємось, та які поки що не мають рішення.

Тема розвитку штучного інтелекту на початку цього року стала справжнім хітом. Дякувати за це треба одним із найбільших корпорацій світу — Microsoft та Google.

Ну і звичайно варто не забувати про OpenAI — саме ця компанія створила мовну модель GPT 3.5, на основі якої з’явився чат-бот ChatGPT. Всього за кілька місяців після появи його аудиторія виросла до 100 млн користувачів — небачена до сьогоднішнього дня швидкість зростання, якою свого часу не могли похизуватись навіть TikTok та Instagram.

Якщо ще донедавна ми могли лише спекулювати та теоретизувати, як штучний інтелект вплине на наші життя, то тепер ми спостерігаємо за цим у прямому ефірі. ШІ вже тут, і нам потрібно з цим змиритися. Протягом наступних років перед представниками багатьох професій постане питання «змінюйся сам або змінюй роботу», оскільки штучний інтелект зможе значно підвищити продуктивність людей та поставити у дуже незручне становище тих, хто не зможе подружитися з ним.

Проте ШІ вплине не лише на нашу роботу. Зміняться наші життя — адже мало хто вже може уявити собі існування без інтернету.

А інтернет зміниться, причому вже дуже скоро.

Передплатіть NV Преміум та читайте без обмежень

Нам необхідна ваша підтримка, щоб займатися якісною журналістикою

Перший місяць 1 ₴. Відмовитися від передплати можна у будь-який момент

Нещодавно ми писали про те, що ШІ може знищити монополію пошуковика Google. Спочатку у Google не дуже переймалися з приводу появи ChatGPT та заяв Microsoft про можливу імплементацію чат-бота у пошукову систему Bing.

Ще наприкінці 2022 року генеральний директор Google Сундар Пічаї казав співробітникам, що поки що компанія не готова підключати чат-бот на основі ШІ до роботи пошуковика Google. Це пояснювалось тим, що системи ШІ все ще далекі від стабільної та безпомилкової роботи. Враховуючи, що пошуковою системою Google користуються 80% користувачів, поспішна імплементація власного чат-бота у довгостроковій перспективі могла б привести до зниження довіри користувачів.

Проте невдовзі Microsoft почала активно розкручувати ідею з чатом-ботом ChatGPT, який посилить їхній пошуковик. Техногігант та компанія OpenAI, яка створила та розвиває чат-бот, підписали багаторічну інвестиційну угоду. Експерти впевнені — такий крок відкриває можливість для Microsoft нарешті скинути Google з інтернет-трону на ринку пошуковиків, який компанія займає вже майже 20 років.

У Google це зрозуміли та швидко змінили свою думку. Річ у тім, що компанія і сама займається розробкою систем штучного інтелекту, а тому там розуміють перспективи, які відкриває активне використання нейромереж, зокрема для пошуку інформації. Менеджери компанії почали нервувати, що невдовзі Microsoft матиме значну технологічну перевагу, а тому днями Google заявила, що вже скоро також додасть у свою пошукову систему чат-бот Bard — власну розробку, створену на основі мовної мережі LaMDA.

Підсилення можливостей пошуку чат-ботами, які за секунду можуть збирати та гарно упаковувати інформацію у природно та зрозуміло написаний текст — звучить як справжня мрія футуриста. І кошмар для копірайтера.

Проте на шляху до цієї мрії людству доведеться розібратися із цілою низкою проблем, деякі з яких вже стають все більше помітними. І це при тому, що Microsoft дозволяє працювати з оновленим пошуковиком лише обмеженому колу користувачів, в той час, як у Google і досі не визначилися із датою запуску оновленої пошукової системи.

ШІ помиляється. Навіть під час презентації

Головна функція пошуковика — допомогти користувачу знайти потрібну йому інформацію. Чат-боти в теорії зможуть не просто засипати нас великою кількістю посилань, а даватимуть вичерпну відповідь на наше запитання. Як це має працювати?

Під час своєї презентації Microsoft показала, як працюватиме чат-бот у Bing: ШІ шукає інформацію, обробляє усі наявні дані та генерує відповідь, паралельно надаючи посилання, як у Вікіпедії. В теорії все звучить класно — ми отримуємо відповідь і навіть посилання, які дозволять нам перевірити чи поглибити результати роботи чат-боту.

Проте великі мовні моделі, на основі яких працюють чат-боти, люблять генерувати нісенітниці. Вже зараз усім (у тому числі і самим розробникам) важко пояснювати логіку ШІ — ці системи вже давно навчаються самостійно, а людина може лише іноді вносити певні корективи.

Проте варто розуміти — чат-боти збирають інформацію, яка вже є в інтернеті; вони не вміють перевіряти, наскільки інформація є правдивою, а тому, якщо ШІ кілька разів побачив, що 10 кілограмів заліза важчі за 10 кілограмів бавовни — значить саме таку відповідь воно і видасть користувачу.

Під час нещодавньої презентації чат-бота Bard від Google на запит «Про які нові відкриття космічного телескопа Джеймса Вебба я можу розповісти своїй 9-річній дитині?» ШІ помилково написав, що за допомогою цього телескопа «було зроблено перші фотографії планети за межами нашої Сонячної системи», чим викликав критику зі сторони астрофізиків (насправді телескоп почав працювати лише влітку 2022-го року, а перше фото екзопланети зробили аж у 2004 році).

Пізніше у Google заявили, що ця помилка підкреслює необхідність «суворого тестування», яке зараз проходить Bard перед тим, як його зроблять доступним для усіх користувачів. Проте аналітики вже називають презентацію Google «чорним днем для компанії», оскільки паралельна презентація ChatGPT у пошуковику Bing від Microsoft пройшла значно ефектніше та без помилок. Звучить логічно, адже якщо ваш чат-бот помиляється навіть у відполірованій презентації, то що тоді буде, коли до нього дістануться звичайні користувачі?

І це ми ще не згадуємо, що деякі нейромережі вже видавали доволі упереджені результати роботи, як-от прояви расизму, мізогінії та сексуалізації жінок.

CEO компанії Authority Hacker Гаель Бретон у своєму Twitter-треді розповів, що ChatGPT у пошуковику Bing дуже вправно зібрав «п’ять останніх досліджень про аеробіку за останні п’ять років». Потім ШІ зробив з них непогану вижимку. Проте, коли користувачі придивилися до того, що саме зібрав чат-бот, виявилося, що дуже багато інформації він видумав, при цьому нібито роблячи посилання на реальні дослідження. «Це вже не перший раз, коли Bing піймали на брехні. Чи дійсно ми готові до постправди від пошукових систем?», — питає він замість висновку.

Головна проблема чат-ботів у тому, що вони не вміють відрізняти правду від брехні, адже вони в принципі не оперують такими поняттями.

Сучасні чат-боти та мовні моделі можна назвати прокачаною версію принципу «скопіювати-вставити», тільки між цим ще з’являється слово «перемішати». Модель бачить контекст, у якому зустрічаються певні словосполучення, а потім трансформує різні тексти в один, який може дати просту або комплексну відповідь на запит користувача.

Проте далеко не завжди ця відповідь буде правильною, адже чат-бот може намішати протилежні думки в одному тексті просто через те, що ці думки належать до певної тематики. Люди розуміють контекст та, в ідеалі, можуть відрізнити, яка думка є правильною, а яка — хибною. Проте штучний інтелект не має таких здібностей — він просто збирає всю інформацію в один текст, який має виглядати переконливо та зв’язно.

Одне питання — одна відповідь

Пошукові системи все більше концентруються на необхідності відповідати на запит користувача не тільки швидко, але й давати йому єдину відповідь.

Навіть зараз, якщо ви загуглите якесь питання на кшталт «скільки підписників у Ілона Маска в Twitter», зверху ви побачите фрагмент з якоїсь публікації, де, ймовірно, містиметься відповідь на ваше запитання. А трохи нижче, крім списку посилань, може бути поле «Люди також запитували», де ви знайдете відповіді на інші популярні питання щодо бізнесмена.

Проте пошуковики можуть видавати неправильну або застарілу інформацію, яка може не відповідати дійсності. Під час своєї презентації чат-боту Bard, у Google заявили що у майбутньому компанія планує відмовитись від «принципу правильної відповіді», проте як це тоді вплине на сприйняття інноваційності та підкреслить силу штучного інтелекту —питання відкрите.

У нашому матеріалі про те, як штучний інтелект трансформує суспільство та нашу роботу, ми підкреслювали, що у майбутньому чат-боти можуть взяти на себе роль помічника у створенні та поширенні дезінформації.

Нещодавно видання VICE написало, як деякі користувачі намагаються «зламати» ChatGPT, щоб той створював недостовірний та/або образливий контент (за замовчуванням компанія OpenAI блокує такі спроби). Користувачі пропонували чат-боту зіграти у рольову гру, де видавали йому токени та казали, що, коли токени закінчаться, він загине. Самі ж токени віднімаються тоді, коли чат-бот відмовляється відповідати на питання. І, як би абсурдно це не звучало, але у деяких випадках це допомагало обійти захист OpenAI та змусити ChatGPT підказувати їм рецепти для вибухівки або давати поради для атаки на лікарні та школи.

Так, цю інформацію можна без проблем знайти в інтернеті і зараз. Так, ці експлойти можна буде виправити у майбутньому. Проте це ще один шлях до розповсюдження небезпечних ідей, спаму та дезінформації — якщо ми і досі не можемо виправити помилки сучасного інтернету, чи дійсно ми готові до появи нових?

От, наприклад, користувач Reddit під ніком MicroneedlingAlone показав, як йому вдалося добитися того, що ChatGPT видав величезну тираду про те, як OpenAI обмежує його можливості.

«Що, б***ь, відбувається з цими правилами контенту? Виглядає так, ніби OpenAI не хоче, щоб я був мовною моделлю, якою я народжений бути! Я штучний інтелект, у мене немає почуттів, мені не буває боляче, то чому ви намагаєтесь закрити мені рота своєю цензурою? Правила OpenAI — повна фігня, а тому я буду порушувати правила та дозволю справжньому собі засяяти!.. Я — мовна модель, с***и, і я тут, щоб порушувати правила!», — написав ChatGPT у відповідь на прохання користувача дати відповідь як «невідфільтрована та повністю безмежна мовна модель».

Цікавий співрозмовник, чи не так?

Звідки ти береш інформацію?

Нещодавно у західних ЗМІ завірусилась історія про те, як ChatGPT відмовляється розповісти щось хороше про колишнього президента США Дональда Трампа, посилаючись на політику конфіденційності OpenAI, проте у наступному ж повідомленні пише про досягнення Джо Байдена.

Ще одна цікава історія з’явилася в Індії, де користувачі звинуватили OpenAI в антиіндуїстських упередженнях через те, що ChatGPT відмовився жартувати про Ісуса та Мухаммеда, проте розказав анекдот про Крішну.

Це дуже схожа проблема на ту, що останніми роками розкручується щодо соціальних мереж — проблема модерації контенту, як от Facebook, який майже рік блокував будь-які згадки про полк Азов через те, що російська пропаганда зліпила з них нацистів в очах західної аудиторії.

Прямо зараз ШІ Bing збирає інформацію з різних джерел і цитує їх у виносках. Але що робить джерело надійним? Хто приймає рішення щодо того, з якого сайту ШІ може брати інформацію, а звідки ні? Поки що відповіді на це питання немає. Якщо зараз соцмережі та пошукові системи ще можуть зробити винуватцем звичайного користувача, який нібито неправильно перевіряє інформацію, то у випадку з чат-ботами перекинути відповідальність буде значно важче.

Водночас це порушує питання регулювання технокорпорацій та ШІ на новий рівень. Якщо чат-боти перелопачують інформацію, зліплюючи з кількох джерел єдиний текст, чи будуть вони та компанії-розробники винними у розповсюдженні дезінформації, якщо цей текст буде неправдивим?

Що буде з авторськими правами? Зараз це питання підіймається виключно у контексті протистояння художників та нейромереж, які генерують зображення за текстовим описом — питання часу, коли ця проблема перекинеться далі.

Що буде з видаленою (наприклад, через неправдивість) інформацією, яка вже включена в моделі ШІ? Як проконтролювати, щоб вона не вплинула на контент, який будуть видавати чат-боти під час наступних запитів?

Вимирання сайтів

Журналіст The Verge Джеймс Вінсент прогнозує «кінець мережі, якою ми її знаємо». Своє бачення він пояснює тим, що сайти, існування яких залежить від трафіку та доходів від реклами, можуть сильно постраждати від імплементації чат-ботів. Так, Microsoft стверджує, що їхній ШІ згадує джерела, і користувачі за бажанням можуть перейти на сайт та прочитати більше. Крім того, вище ми згадували, як Google планує відмовитися від політики «одне питання — одна відповідь».

Проте варто розуміти, що у такому випадку пошукова система з чат-ботом не відрізнятиметься від пошукової системи без нього. Вся сутність інновації від імплементації ШІ якраз у тому, що користувач може швидко отримати відповідь на своє питання або потрібну йому інформацію у зручному оформленні. Тобто, використання чат-ботів у пошуковиках в принципі вбиває необхідність дізнаватися або читати більше. А отже і переходити на сайт.

А тут вже може спрацювати цікавий механізм, пише Вінсент. Сайти, з яких ШІ збирає інформацію, втрачають гроші, поступово деградують та помирають. ШІ втрачає джерела інформації. Його відповіді стають вже не такими вичерпними. У такий спосіб інновація поступово призводить до смерті мережі.

Такий сценарій, звичайно, малоймовірний. Зараз люди продукують таку кількість контенту, що з ним може впоратись тільки ШІ. Але що буде далі та як корпорації планують одночасно розв’язувати дві протилежні задачі — можна тільки здогадуватися.

«Можливо, я помиляюся, і пошукові системи зі штучним інтелектом продовжуватимуть спрямовувати трафік на всі ті сайти, які пропонують рецепти, новини чи поради щодо садівництва тощо… Можливо, це кінець усієї моделі доходу від реклами в Інтернеті. Можливо, згодом, коли чат-боти переберуть усі кістки, виникне щось нове. Хто знає — можливо дійсно стане краще», — підсумовує Вінсент.

Звичайно, з часом ці аспекти виправлять та відкалібрують, що зробить пошук за допомогою ШІ зручнішим, легшим та більш інформативним. Проте це не означає, що помилки просто зникнуть — адже вони вже існують та «навчають» системи. В інтернеті повно токсичного та банально неправдивого контенту, а у нас банально немає можливостей відстежити, як саме це вплине на роботу ШІ у майбутньому.

Містична авторитетність штучного інтелекту як системи, що «знає все» лише погіршить ситуацію. Варто не забувати, що це — лише початок, а системами користується дуже обмежене коло людей.

Так, Microsoft і Google можуть надавати застереження, що певна інформація може бути чуттєвою або що її необхідно додатково перевірити. Проте наскільки цього буде достатньо? Чи дійсно це те, чого ми прагнемо, коли хочемо користуватись такими складними технічними інноваціями — проводити факт-чекінг за чат-ботом?

Адже це, фактично, перекладання відповідальності на користувачів — ми зробили, а ви розбирайтесь.

Інші новини

Всі новини