NV Премиум

Не ведаем, что творим. Почему ученые никак не могут договориться о том, как развивать искусственный интеллект

Инновации

30 декабря 2024, 20:02

Даже ведущие разработчики искусственного интеллекта до конца не понимают, как он должен работать. Как это возможно? NV. Попытался разобраться в этом.

Нечто действительно интересное случилось в начале октября в ходе конференции Credo AI, собравшей ведущих разработчиков в сфере искусственного интеллекта (ИИ) в Сан-Франциско.

В разгар большой дискуссии кто-то из зала спросил сидевшую на сцене американку китайского происхождения Фей-Фей Ли, что такое AGI (ИИ общего назначения). И она в ответ сказала, что не знает.

Фей-Фей Ли — это легенда мира ИИ. Ее часто называют «крестной матерью искусственного интеллекта». Разработки Ли еще в 2000-х предшествовали всем нынешним проектам в сфере ИИ, по сути став их предтечей. Позже Ли работала над ИИ в Google, и сегодня возглавляет один из заметных проектов в этом направлении в Стэнфордском университете.

Кому как не ей знать, что же такое тот самый вожделенный AGI, в погоню за которым устремилась многомиллиардная индустрия ИИ?

Подпишитесь на NV Премиум и читайте без ограничений

Нам необходима ваша поддержка, чтобы заниматься качественной журналистикой

Первый месяц 1 ₴. Отписаться можно в любой момент

Но Фей-Фей Ли открыто заявила собранию своих самых продвинутых коллег, что у нее нет сформировавшегося представления о том, что такое AGI, и как нам его достичь.

Это резко контрастирует, например, с позицией Сэма Альтмана, возглавляющего OpenAI, компанию, которая подарила миру ChatGPT и стала у истоков революции «больших языковых моделей», которые и принято сегодня называть искусственным интеллектом. Альтман дает вроде бы вполне четкое определение того, что такое AGI, намекая, что ChatGPT в своих последних итерациях — это шаг в нужную сторону.

Но и здесь не все просто. Даже некоторая информация, опубликованная на сайте OpenAI, по сути опровергает бодрые заявления ее руководителя.

Есть своя точка зрения на AGI и у Илона Маска — одного из соучредителей OpenAI, позже покинувшего компанию и подавшего в суд на Альтмана и его коллег за то, что те «предали» первоначальную идею и продались Microsoft.

Маск нынче разрабатывает свой собственный ИИ под названием Grok, интегрировав его в соцсеть X (бывший Twitter). И называет вполне определенные сроки для практического воплощения пресловутого AGI — 2029 год. Но и формулировка общей задачи у Маска не похожа на то, о чем говорит его бывший партнер Альтман.

Как же может быть, что индустрия ИИ, в которую сегодня инвестируются чудовищные средства (одна только капитализация OpenAI сегодня составляет более $150 млрд) так и не разобралась в собственных целях и задачах?

Может ли быть так, что индустрии ИИ, объединяющая усилия десятков тысяч лучших разработчиков и выдающихся ученых планеты, движется вслепую и все равно придет к желаемому результату? И кстати, а какой результат мы будем считать желаемым? Ведь тот же Маск еще и уверяет, что пришествие AGI отберет работу у сотен миллионов людей?

Давайте разбираться.

Когда появится искусственный интеллект общего назначения (AGI) / Фото: NV via MIdjourney

Поиски Святого Грааля

Начнем с теории.

AGI — искусственный интеллект общего назначения уже давно считается вершиной исследований в области искусственного интеллекта.

В отличие от узкоспециализированного ИИ, который предназначен для выполнения конкретных задач, AGI относится к машинам, способным понимать, обучаться и применять интеллект для решения любых проблем — подобно человеку.

Если вам доводилось общаться с ChatGPT от OpenAI или Claude от Anthropic или, тем более, использовать их в работе, вы уже имеете общее представление о том, как гипотетически должен работать AGI. Он должен обладать подобием сознания, понимать запросы человека в любой форме, адекватно реагировать на быстро меняющиеся ситуации и быть полезным во всем.

Стремление к AGI сулит революционные изменения во всех отраслях, от здравоохранения до финансов, но также поднимает глубокие этические и экзистенциальные вопросы. Например, тотальной безработицы.

Но как должен функционировать AGI и являются ли большие языковые модели, такие как ChatGPT (очень грубо, их суть в том, что благодаря обучению на больших массивах текстов и данных они могут точно предсказывать, каким должно быть следующее слово в предложении или предложение в тексте) прообразом AGI?

Вот тут мнения исследователей и разработчиков расходятся. Причем, довольно сильно.

Некоторые считают, что в основе AGI лежит стремление воспроизвести в машинах весь спектр когнитивных способностей человека.

Доктор Бен Гертцель, генеральный директор SingularityNET и одна из ведущих фигур в области исследований AGI, описывает AGI как создание машин, способных выполнять любые интеллектуальные задачи, которые под силу человеку. Это означает, что система AGI будет не просто преуспевать в одной области, а обладать способностью к адаптации и пониманию, чтобы решать различные задачи, учиться на новом опыте и даже проявлять творческие способности. Ей должно быть под силу самостоятельное обучение в сфере, в которой ее заранее не тренировали на больших массивах данных.

В то же время Сэм Альтман в своей прошлогодней колонке для The New Yorker описал AGI как «эквивалент среднего человека, которого вы могли бы нанять в качестве сослуживца».

Забавно, но при этом в документации OpenAI концепция AGI описывается несколько иначе — как «высокоавтономные системы, превосходящие человека в наиболее экономически выгодной работе».

В проектах OpenAI описывается пять уровней прогресса на пути к AGI. Первый уровень — это чат-боты (такие, как ChatGPT первых поколений), и это уровень уже пройден. На втором урове — разумные существа (здесь речь идет уже о таком уровне как последная модель ChatGPT o1, превью которой уже доступно для платных пользователей сервиса).

На третьему и четвертом уровне будут более современные агенты-инноваторы, способные не только обслуживать запросы, но и изобретать вещи и создавать проекты). И последний уровень — организационный, это будет ИИ, который может выполнять работу целой организации.

Стремление к созданию AGI подпитывается потенциальными преимуществами, которые он может принести. В здравоохранении AGI может произвести революцию в диагностике и персонализированной медицине, синтезируя огромные массивы медицинских данных для выявления закономерностей, которые не под силу человеку. В экологии он может моделировать сложные климатические системы, чтобы лучше предсказывать и смягчать последствия изменения климата.

Доктор Демис Хассабис, соучредитель и генеральный директор DeepMind, считает, что AGI может помочь решить некоторые из самых насущных проблем человечества. И будет доступен примерно к 2030 году.

Однако, не все ученые считают, что такой подход описывает AGI. Все описанные выше задачи все еще являются проявлениями «узкого» ИИ, пусть и с довольно широкими возможностями.

Например, Фей-Фей Ли, «крестная мать ИИ», настроена довольно скептично. Ли знает про ИИ больше многих.

«Я пришла из академического ИИ и была воспитана на более строгих и основанных на доказательствах методах, поэтому я не очень понимаю, что означают все эти слова», — сказала Ли в ответ на вопрос, когда мы достигнем AGI и «сингулярности ИИ» (так часто называют гипотетический момент, когда ИИ станет сравним с человеком по интеллекту).

«Я, честно говоря, даже не знаю, что означает AGI, — добавила Ли. — Как говорят люди, вы узнаете это, когда увидите, но я, похоже, этого не видела. По правде говоря, я не трачу много времени на обдумывание этих слов, потому что, на мой взгляд, есть много более важных дел».

Ли намекает, что процесс создании совершенного ИИ все еще находится на зачаточном этапе.

И это при том, что для нее, в отличие от многих исследователей, которые присоединились к гонке лишь недавно, все это длится уже два десятилетия.

В 2006 году она создала ImageNet, первый в мире большой набор данных для обучения и тестирования больших моделей, который стал катализатором нынешнего бума ИИ.

С 2017 по 2018 год она занимала должность главного научного сотрудника по ИИ в Google Cloud. Сегодня Ли возглавляет Стэнфордский институт человекоцентрированного ИИ, а также запустила собственный стартап World Labs.

По словам Ли, в основе всех нынешних разработок стоят три фактора — наука о больших данных (Big Data), развитие самообучающихся нейронных сетей и вычислительные мощности графических процессоров, на которых построены современные модели ИИ.

Но этого мало.

Ли считает, что"пространственный интеллект" нужно приблизить к реальности. И на это уйдет какое-то время. Ведь по ее словам, на развитие человеческого языка, на котором основаны современные большие языковые модели, ушел, вероятно, миллион лет. Ну а развитие зрения и восприятия, скорее всего, заняли более 500 млн лет.

А мы намерены втиснуть создание AGI в пару десятилетий.

«Нужно не просто заставить компьютеры видеть, а заставить их понимать весь трехмерный мир, что я называю пространственным интеллектом», — говорит Ли.

Илон Маск смотрит на вещи гораздо более оптимистично. Возможности новых моделей ИИ превзойдут человеческий разум уже к концу 2025 года, считает он. А полный AGI будет достигнут к 2029 году.

Маск, когда-то стоявший у истоков OpenAI, а потом разошедшийся во взглядах с Альтманом и другими учредителями, сегодня активно развивает Grok. Этот ИИ интегрирован в принадлежащую Маску соцсеть X (бывший Twitter), и доступен по подписке.

По словам Маска, сейчас обучение моделей ИИ затрудняется нехваткой передовых чипов. В одном из недавних интервью Маск рассказывал, что модель Grok 2, которая по его мнению, во всем превосходит GPT-4 компании OpenAI, нуждается в огромных вычислительных мощностях. Для обучения Grok 2 потребовалось около 20 000 чипов Nvidia H100, а для более совершенной Grok 3 их необходимо около 100 000.

Маск также считает, что на пути к созданию AGI стоит такая преграда, как нехватка электроэнергии. Экологи уже бьют тревогу, подсчитывая, что один запрос к ChatGPT уже потребляет больше энергии, чем поисковый запрос в Google. И в целом индустрия ИИ уже превосходит по энергопотреблению майнинг биткоина. Маск предлагает заранее предусмотреть пути решения энергетических проблем на пути к AGI.

Grok много в чем уступает ChatGPT и Claude, но у него уже есть своя фанатская база, и довольно большая. Маск сделал Grok максимально свободным от политкорректности, которая, по его мнению, «душит» другие варианты ИИ.

И это выводит на еще один виток разговора о достижимости AGI.

Ведь ИИ — это не только вычислительные способности, это еще и набор определенных ценностей. Учитывая, какой мощью будет он будет обладать, крайне важно, чтобы эта мощь применялась исключительно в благих целях. Многие ученые предостерегают от чересчур быстрого прогресса в этой сфере, например, такой точки зрения придерживался покойный Стивен Хокинг. Он говорил, что достигший сингулярности ИИ может привести к гибели человечества.

Эту точку зрения разделяют многие. Так, профессор Стюарт Рассел из Калифорнийского университета в Беркли изучает стратегии согласования ИИ, чтобы системы AGI действовали с пользой для человечества. По мнению Рассела, включение этических аспектов в процесс разработки для снижения рисков не менее важно, чем другие технологические аспекты создания ИИ.

Ну а по состоянию на текущий момент прийти к согласию по ключевым вопросам этических аспектов представляется весьма непростой задачей. Так, к примеру, созданный в недрах OpenAI графический ИИ DALL-E отказывается рисовать политические карикатуры на Дональда Трампа и Камалу Харрис. В то время как Grok Илона Маска делает это с легкостью.

И у того, и у другого ИИ — масса довольных и благодарных пользователей.

Особое мнение Apple

В то время, как все вокруг восхищаются существующими моделями генеративного ИИ, а ученые ломают копья относительно того, что такое AGI, и как нам его достичь, несколько обособленную позицию занимает компания Apple.

Несмотря на то, что ее со-основателя и многолетнего руководителя Стива Джобса уже давно нет с нами, Apple все еще словно бы живет по его заветам. Одним из них было отсутствие спешки в погоне за конкурентами. Многие помнят, как Джобс не спешил интегрировать некоторые функции в айфон, приговаривая «мы не первые, но мы будем лучшими».

Под управлением Тима Кука компания часто действует в том же духе. В то время, как остальные техногиганты активно интегрируют ИИ в свои продукты и сами ведут разработки, Apple никуда не спешит. Даже в новом iPhone 16 функции ИИ пока представлены в обрезанном виде и доступны далеко не всем пользователям.

Ну а тем временем Apple не ограничивает себя в критике существующих разработок в области ИИ.

Новое исследование, проведенное шестью инженерами Apple, показывает, что математические «рассуждения», демонстрируемые продвинутыми большими языковыми моделями, могут быть чрезвычайно ненадежными в некоторых совершенно тривиальных задачах.

Исследование показывает, что эти модели, мягко говоря, не очень «дружат» с математикой. Используя вероятностное сопоставление шаблонов, они порой демонстрируют полное непонимание базовых математических концепций.

Исследователи опробовали популярные модели генеративного ИИ на стандартизированном наборе GSM8K из более чем 8 000 математических задач школьного уровня, который часто используется в качестве эталона для тестирования вычислительных систем.

При этом они проверяли ИИ как на стандартных задачах, так с измененными заданиями, которые требуют переосмысления логики задачи.

Средняя точность ответов у современных ИИ была очень высока, например, последние модели ChatGPT получали более 90%. Но не обошлось без досадных казусов, которые в задачу о количестве киви, которое персонаж получает в течение нескольких дней было внесено дополнение, гласившее, что в один из дней киви были меньшего размера. ИИ с чистой совестью удалял более маленькие киви из уравнения, хотя в изначальных условиях не было ничего о том, что размер плода вообще имеет значение для общего подсчета.

Несмотря на то, что в работе исследователей из Apple вопрос о достижении AGI вообще напрямую не обсуждается, выводы в работе все же неутешительные.

Подобно некоторым другим исследованиям, работа Apple говорит о том, что большие языковые модели не способны выполнять формальные рассуждения. Они лишь имитируют их при помощи имеющихся в их обширных базах данных, которые максимально похожи на те, что запрашивает пользователь.

И если простенькая подсказка или изменение в условиях подталкивает к ходу рассуждений, который отличается от имеющихся шаблонов, имитация становится ошибочной.

«Нынешние большие языковые модели не способны к подлинным логическим рассуждениям, — заключают исследователи из Apple. — Вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в обучающих данных».

По мнению обозревателя Ars Technica Бенджа Эдвардса, это несколько меняет наше воспринятие текущего развития ИИ.

«Одна из причин, по которой GPT-4 от OpenAI вскружила голову в синтезе текста, — говорит Эдвардс. — Заключается в том, что модель наконец достигла такого размера, что поглотила достаточно информации (в обучающих данных), чтобы создать впечатление, что она может действительно понимать и моделировать мир, хотя на самом деле ключевым аспектом ее успеха является то, что она „знает“ гораздо больше, чем большинство людей, и может впечатлить нас, комбинируя эти существующие концепции новыми способами».

При наличии достаточного количества обучающих данных и вычислений индустрия ИИ, вероятно, достигнет того, что можно назвать «иллюзией понимания», — заключает Эдвардс.

По мнению Гэри Маркуса, эксперта в области ИИ, следующий большой скачок в возможностях ИИ произойдет только тогда, когда эти нейронные сети смогут интегрировать истинное «манипулирование символами, в котором некоторые знания представлены действительно абстрактно в терминах переменных и операций над этими переменными, как мы видим в алгебре и традиционном компьютерном программировании».

И пока этого не случилось, общаясь с большими языковыми моделями, мы будем получать такие хрупкие «рассуждения», которые могут привести к тому, что ИИ будет ошибаться в математических задачах, в которых никогда не ошибаются калькуляторы.

Тот ли это искусственный интеллект, о котором мечтательно говорит Фей-Фей Ли? Судя по всему, нет. И как сделать так, чтобы два этих видения встретились в реальности, пока никто точно сказать не может.

Другие новости

Все новости