Не відаємо, що творимо. Чому вчені ніяк не можуть домовитися про те, як розвивати штучний інтелект
Інновації30 грудня 2024, 20:02
Щось справді цікаве трапилося на початку жовтня під час конференції Credo AI, що зібрала провідних розробників у сфері штучного інтелекту (ШІ) у Сан-Франциско.
У розпал великої дискусії хтось із залу запитав американку китайського походження Фей-Фей Лі, яка сиділа на сцені, що таке AGI (ШІ загального призначення). І вона у відповідь сказала, що не знає.
Фей-Фей Лі - це легенда світу ШІ. Її часто називають «хрещеною матір'ю штучного інтелекту». Розробки Лі ще у 2000-х передували всім нинішнім проєктам у сфері ШІ, по суті ставши їхньою предтечею. Пізніше Лі працювала над ШІ в Google, і сьогодні очолює один із помітних проєктів у цьому напрямі в Стенфордському університеті.
Кому як не їй знати, що ж таке той самий жаданий AGI, у гонитву за яким кинулася багатомільярдна індустрія ШІ?
Передплатіть NV Преміум та читайте без обмежень
Нам необхідна ваша підтримка, щоб займатися якісною журналістикою
Але Фей-Фей Лі відкрито заявила зборам своїх найпросунутіших колег, що у неї немає сформованого уявлення про те, що таке AGI, і як нам його досягти.
Це різко контрастує, наприклад, з позицією Сема Альтмана, який очолює OpenAI, компанію, що подарувала світові ChatGPT і стала біля витоків революції «великих мовних моделей», які й заведено сьогодні називати штучним інтелектом. Альтман дає начебто цілком чітке визначення того, що таке AGI, натякаючи, що ChatGPT у своїх останніх ітераціях — це крок у потрібний бік.
Але і тут не все просто. Навіть деяка інформація, опублікована на сайті OpenAI, по суті спростовує бадьорі заяви її керівника.
Є своя точка зору на AGI і в Ілона Маска — одного зі співзасновників OpenAI, який пізніше залишив компанію і подав до суду на Альтмана і його колег за те, що ті «зрадили» початкову ідею і продалися Microsoft.
Маск нині розробляє свій власний ШІ під назвою Grok, інтегрувавши його в соцмережу X (колишній Twitter). І називає цілком певні терміни для практичного втілення горезвісного AGI — 2029 рік. Але і формулювання загального завдання у Маска не схоже на те, про що говорить його колишній партнер Альтман.
Як же може бути, що індустрія ШІ, в яку сьогодні інвестують шалені кошти (одна тільки капіталізація OpenAI сьогодні становить понад $150 млрд) так і не розібралася у власних цілях і завданнях?
Чи може бути так, що індустрія ШІ, яка об'єднує зусилля десятків тисяч найкращих розробників і найвизначніших учених планети, рухається наосліп і все одно прийде до бажаного результату? І до речі, а який результат ми вважатимемо бажаним? Адже той же Маск ще й запевняє, що пришестя AGI забере роботу в сотень мільйонів людей?
Давайте розбиратися.
Пошуки Святого Грааля
Почнемо з теорії.
AGI — штучний інтелект загального призначення вже давно вважається вершиною досліджень у галузі штучного інтелекту.
На відміну від вузькоспеціалізованого ШІ, який призначений для виконання конкретних завдань, AGI відноситься до машин, здатних розуміти, навчатися і застосовувати інтелект для вирішення будь-яких проблем — подібно до людини.
Якщо вам доводилося спілкуватися з ChatGPT від OpenAI або Claude від Anthropic чи, тим паче, використовувати їх у роботі, ви вже маєте загальне уявлення про те, як гіпотетично має працювати AGI. Він повинен мати подобу свідомості, розуміти запити людини в будь-якій формі, адекватно реагувати на мінливі ситуації, що швидко змінюються, і бути корисним у всьому.
Прагнення до AGI обіцяє революційні зміни в усіх галузях, від охорони здоров’я до фінансів, але також піднімає глибокі етичні та екзистенційні питання. Наприклад, тотального безробіття.
Але як має функціонувати AGI і чи є великі мовні моделі, як-от ChatGPT (дуже грубо, їхня суть у тому, що завдяки навчанню на великих масивах текстів і даних вони можуть точно передбачати, яким має бути наступне слово в реченні або речення в тексті) прообразом AGI?
Ось тут думки дослідників і розробників розходяться. Причому, досить сильно.
Дехто вважає, що в основі AGI лежить прагнення відтворити в машинах весь спектр когнітивних здібностей людини.
Доктор Бен Гертцель, генеральний директор SingularityNET і одна з провідних фігур у галузі досліджень AGI, описує AGI як створення машин, здатних виконувати будь-які інтелектуальні завдання, які під силу людині. Це означає, що система AGI буде не просто процвітати в одній галузі, а матиме здатність до адаптації та розуміння, щоб розв’язувати різні завдання, навчатися на новому досвіді і навіть проявляти творчі здібності. Їй має бути під силу самостійне навчання у сфері, в якій її заздалегідь не тренували на великих масивах даних.
Водночас Сем Альтман у своїй минулорічній колонці для The New Yorker описав AGI як «еквівалент середньої людини, яку ви могли б найняти як товариша по службі».
Кумедно, але водночас у документації OpenAI концепція AGI описується дещо інакше — як «високоавтономні системи, що перевершують людину в найбільш економічно вигідній роботі».
У проєктах OpenAI описується п’ять рівнів прогресу на шляху до AGI. Перший рівень — це чат-боти (такі, як ChatGPT перших поколінь), і цей рівень уже пройдено. На другому рівні - розумні істоти (тут ідеться вже про такий рівень як остання модель ChatGPT o1, прев’ю якої вже доступне для платних користувачів сервісу).
На третьому і четвертому рівні будуть більш сучасні агенти-інноватори, здатні не тільки обслуговувати запити, а й винаходити речі та створювати проєкти). І останній рівень — організаційний, це буде ШІ, який може виконувати роботу цілої організації.
Прагнення до створення AGI підживлюється потенційними перевагами, які він може принести. В охороні здоров’я AGI може зробити революцію в діагностиці та персоналізованій медицині, синтезуючи величезні масиви медичних даних для виявлення закономірностей, які не під силу людині. В екології він може моделювати складні кліматичні системи, щоб краще передбачати і пом’якшувати наслідки зміни клімату.
Доктор Деміс Хассабіс, співзасновник і генеральний директор DeepMind, вважає, що AGI може допомогти розв’язати деякі з найнагальніших проблем людства. І буде доступний приблизно до 2030 року.
Однак, не всі вчені вважають, що такий підхід описує AGI. Усі описані вище завдання все ще є проявами «вузького» ШІ, нехай і з досить широкими можливостями.
Наприклад, Фей-Фей Лі, «хрещена мати ШІ», налаштована досить скептично. Лі знає про ШІ більше за багатьох.
«Я прийшла з академічного ШІ і була вихована на більш суворих і заснованих на доказах методах, тому я не дуже розумію, що означають усі ці слова», — сказала Лі у відповідь на запитання, коли ми досягнемо AGI і «сингулярності ШІ« (так часто називають гіпотетичний момент, коли ШІ стане порівнянним з людиною за інтелектом).
«Я, чесно кажучи, навіть не знаю, що означає AGI, — додала Лі. — Як кажуть люди, ви дізнаєтеся це, коли побачите, але я, схоже, цього не бачила. Чесно кажучи, я не витрачаю багато часу на обмірковування цих слів, тому що, на мій погляд, є багато важливіших справ».
Лі натякає, що процес створення досконалого ШІ все ще перебуває на зародковому етапі.
І це при тому, що для неї, на відміну від багатьох дослідників, які долучилися до перегонів лише нещодавно, все це триває вже два десятиліття.
У 2006 році вона створила ImageNet, перший у світі великий набір даних для навчання і тестування великих моделей, який став каталізатором нинішнього буму ШІ.
З 2017 по 2018 рік вона обіймала посаду головного наукового співробітника зі ШІ в Google Cloud. Сьогодні Лі очолює Стенфордський інститут людиноцентрованого ШІ, а також запустила власний стартап World Labs.
За словами Лі, в основі всіх нинішніх розробок стоять три чинники — наука про великі дані (Big Data), розвиток нейронних мереж, які самонавчаються, та обчислювальні потужності графічних процесорів, на яких побудовані сучасні моделі ШІ.
Але цього мало.
Лі вважає, що «просторовий інтелект» потрібно наблизити до реальності. І на це піде якийсь час. Адже за її словами, на розвиток людської мови, на якій засновані сучасні великі мовні моделі, пішов, ймовірно, мільйон років. Ну а розвиток зору і сприйняття, найімовірніше, зайняли понад 500 млн років.
А ми маємо намір втиснути створення AGI у кілька десятиліть.
«Потрібно не просто змусити комп’ютери бачити, а змусити їх розуміти весь тривимірний світ, що я називаю просторовим інтелектом», — каже Лі.
Ілон Маск дивиться на речі набагато оптимістичніше. Можливості нових моделей ШІ перевершать людський розум уже до кінця 2025 року, вважає він. А повний AGI буде досягнуто до 2029 року.
Маск, який колись стояв біля витоків OpenAI, а потім розійшовся в поглядах з Альтманом та іншими засновниками, сьогодні активно розвиває Grok. Цей ШІ інтегрований у соцмережу X (колишній Twitter), що належить Маску, і доступний за передплатою.
За словами Маска, зараз навчання моделей ШІ ускладнюється браком передових чипів. В одному з недавніх інтерв'ю Маск розповідав, що модель Grok 2, яка, на його думку, в усьому перевершує GPT-4 компанії OpenAI, потребує величезних обчислювальних потужностей. Для навчання Grok 2 знадобилося близько 20 000 чипів Nvidia H100, а для більш досконалої Grok 3 їх необхідно близько 100 000.
Маск також вважає, що на шляху до створення AGI стоїть така перепона, як брак електроенергії. Екологи вже б’ють на сполох, підраховуючи, що один запит до ChatGPT уже споживає більше енергії, ніж пошуковий запит у Google. І загалом індустрія ШІ вже перевершує за енергоспоживанням майнінг біткоїна. Маск пропонує заздалегідь передбачити шляхи вирішення енергетичних проблем на шляху до AGI.
Grok багато в чому поступається ChatGPT і Claude, але в нього вже є своя фанатська база, і досить велика. Маск зробив Grok максимально вільним від політкоректності, яка, на його думку, «душить» інші варіанти ШІ.
І це виводить на ще один виток розмови про досяжність AGI.
Адже ШІ - це не тільки обчислювальні здібності, це ще й набір певних цінностей. З огляду на те, яку міць він матиме, вкрай важливо, щоб цю міць застосовували винятково в благих цілях. Багато вчених застерігають від надто швидкого прогресу в цій сфері, наприклад, такої точки зору дотримувався покійний Стівен Гокінг. Він говорив, що ШІ, який досяг сингулярності, може призвести до загибелі людства.
Цю точку зору поділяє багато хто. Так, професор Стюарт Рассел з Каліфорнійського університету в Берклі вивчає стратегії узгодження ШІ, щоб системи AGI діяли з користю для людства. На думку Рассела, включення етичних аспектів у процес розробки для зниження ризиків не менш важливе, ніж інші технологічні аспекти створення ШІ.
Ну а станом на поточний момент дійти згоди з ключових питань етичних аспектів видається вельми непростим завданням. Так, наприклад, створений у надрах OpenAI графічний ШІ DALL-E відмовляється малювати політичні карикатури на Дональда Трампа і Камалу Гарріс. У той час як Grok Ілона Маска робить це з легкістю.
І в того, і в іншого ШІ - маса задоволених і вдячних користувачів.
Особлива думка Apple
У той час, як усі навколо захоплюються наявними моделями генеративного ШІ, а науковці ламають списи щодо того, що таке AGI та як нам його досягти, дещо відокремлену позицію займає компанія Apple.
Незважаючи на те, що її співзасновника і багаторічного керівника Стіва Джобса вже давно немає з нами, Apple все ще немов би живе за його заповітами. Одним із них була відсутність поспіху в гонитві за конкурентами. Багато хто пам’ятає, як Джобс не поспішав інтегрувати деякі функції в айфон, примовляючи «ми не перші, але ми будемо кращими».
Під управлінням Тіма Кука компанія часто діє в тому ж дусі. У той час, як інші техногіганти активно інтегрують ШІ у свої продукти і самі ведуть розробки, Apple нікуди не поспішає. Навіть у новому iPhone 16 функції ШІ поки представлені в обрізаному вигляді і доступні далеко не всім користувачам.
Ну а тим часом Apple не обмежує себе в критиці наявних розробок у сфері ШІ.
Нове дослідження, проведене шістьма інженерами Apple, показує, що математичні «міркування», що демонструються просунутими великими мовними моделями, можуть бути надзвичайно ненадійними в деяких абсолютно тривіальних завданнях.
Дослідження показує, що ці моделі, м’яко кажучи, не дуже «дружать» з математикою. Використовуючи ймовірнісне зіставлення шаблонів, вони часом демонструють повне нерозуміння базових математичних концепцій.
Дослідники випробували популярні моделі генеративного ШІ на стандартизованому наборі GSM8K з більш ніж 8 000 математичних задач шкільного рівня, який часто використовують як еталон для тестування обчислювальних систем.
При цьому вони перевіряли ШІ як на стандартних завданнях, так і зі зміненими завданнями, які вимагають переосмислення логіки завдання.
Середня точність відповідей у сучасних ШІ була дуже висока, наприклад, останні моделі ChatGPT отримували понад 90%. Але не обійшлося без прикрих казусів, коли в задачу про кількість ківі, яку персонаж отримує протягом кількох днів, внесли доповнення, в якому йшлося про те, що в один із днів ківі були меншого розміру. ШІ з чистою совістю видаляв більш маленькі ківі з рівняння, хоча в початкових умовах не було нічого про те, що розмір плоду взагалі має значення для загального підрахунку.
Незважаючи на те, що в роботі дослідників з Apple питання про досягнення AGI взагалі безпосередньо не обговорюється, висновки в роботі все ж невтішні.
Подібно до деяких інших досліджень, робота Apple говорить про те, що великі мовні моделі не здатні виконувати формальні міркування. Вони лише імітують їх за допомогою наявних у їхніх великих базах даних, які максимально схожі на ті, що запитує користувач.
І якщо простенька підказка чи зміна в умовах підштовхує до перебігу міркувань, що відрізняється від наявних шаблонів, імітація стає помилковою.
«Нинішні великі мовні моделі не здатні до справжніх логічних міркувань, — підсумовують дослідники з Apple. — Замість цього вони намагаються відтворити кроки міркування, які спостерігаються в навчальних даних».
На думку оглядача Ars Technica Бенджа Едвардса, це дещо змінює наше сприйняття поточного розвитку ШІ.
«Одна з причин, через яку GPT-4 від OpenAI запаморочила голову в синтезі тексту, — каже Едвардс. — Полягає в тому, що модель нарешті досягла такого розміру, що поглинула достатньо інформації (у навчальних даних), щоб створити враження, що вона може справді розуміти й моделювати світ, хоча насправді ключовим аспектом її успіху є те, що вона „знає“ значно більше, ніж більшість людей, і може вразити нас, комбінуючи ці наявні концепції новими способами».
За наявності достатньої кількості навчальних даних і обчислень індустрія ШІ, ймовірно, досягне того, що можна назвати «ілюзією розуміння», — підсумовує Едвардс.
На думку Гері Маркуса, експерта в галузі ШІ, наступний великий стрибок у можливостях ШІ станеться тільки тоді, коли ці нейронні мережі зможуть інтегрувати істинне «маніпулювання символами, в якому деякі знання представлено справді абстрактно в термінах змінних і операцій над цими змінними, як ми бачимо в алгебрі та традиційному комп’ютерному програмуванні».
І поки цього не сталося, спілкуючись із великими мовними моделями, ми отримуватимемо такі тендітні «міркування», що можуть призвести до того, що ШІ помилятиметься в математичних задачах, у яких ніколи не помиляються калькулятори.
Чи той це штучний інтелект, про який мрійливо говорить Фей-Фей Лі? Судячи з усього, ні. І як зробити так, щоб два цих бачення зустрілися в реальності, поки ніхто точно сказати не може.