Не ведаем, что творим. Почему ученые никак не могут договориться о том, как развивать искусственный интеллект
Инновации30 декабря 2024, 20:02
Нечто действительно интересное случилось в начале октября в ходе конференции Credo AI, собравшей ведущих разработчиков в сфере искусственного интеллекта (ИИ) в Сан-Франциско.
В разгар большой дискуссии кто-то из зала спросил сидевшую на сцене американку китайского происхождения Фей-Фей Ли, что такое AGI (ИИ общего назначения). И она в ответ сказала, что не знает.
Фей-Фей Ли — это легенда мира ИИ. Ее часто называют «крестной матерью искусственного интеллекта». Разработки Ли еще в 2000-х предшествовали всем нынешним проектам в сфере ИИ, по сути став их предтечей. Позже Ли работала над ИИ в Google, и сегодня возглавляет один из заметных проектов в этом направлении в Стэнфордском университете.
Кому как не ей знать, что же такое тот самый вожделенный AGI, в погоню за которым устремилась многомиллиардная индустрия ИИ?
Подпишитесь на NV Премиум и читайте без ограничений
Нам необходима ваша поддержка, чтобы заниматься качественной журналистикой
Но Фей-Фей Ли открыто заявила собранию своих самых продвинутых коллег, что у нее нет сформировавшегося представления о том, что такое AGI, и как нам его достичь.
Это резко контрастирует, например, с позицией Сэма Альтмана, возглавляющего OpenAI, компанию, которая подарила миру ChatGPT и стала у истоков революции «больших языковых моделей», которые и принято сегодня называть искусственным интеллектом. Альтман дает вроде бы вполне четкое определение того, что такое AGI, намекая, что ChatGPT в своих последних итерациях — это шаг в нужную сторону.
Но и здесь не все просто. Даже некоторая информация, опубликованная на сайте OpenAI, по сути опровергает бодрые заявления ее руководителя.
Есть своя точка зрения на AGI и у Илона Маска — одного из соучредителей OpenAI, позже покинувшего компанию и подавшего в суд на Альтмана и его коллег за то, что те «предали» первоначальную идею и продались Microsoft.
Маск нынче разрабатывает свой собственный ИИ под названием Grok, интегрировав его в соцсеть X (бывший Twitter). И называет вполне определенные сроки для практического воплощения пресловутого AGI — 2029 год. Но и формулировка общей задачи у Маска не похожа на то, о чем говорит его бывший партнер Альтман.
Как же может быть, что индустрия ИИ, в которую сегодня инвестируются чудовищные средства (одна только капитализация OpenAI сегодня составляет более $150 млрд) так и не разобралась в собственных целях и задачах?
Может ли быть так, что индустрии ИИ, объединяющая усилия десятков тысяч лучших разработчиков и выдающихся ученых планеты, движется вслепую и все равно придет к желаемому результату? И кстати, а какой результат мы будем считать желаемым? Ведь тот же Маск еще и уверяет, что пришествие AGI отберет работу у сотен миллионов людей?
Давайте разбираться.
Поиски Святого Грааля
Начнем с теории.
AGI — искусственный интеллект общего назначения уже давно считается вершиной исследований в области искусственного интеллекта.
В отличие от узкоспециализированного ИИ, который предназначен для выполнения конкретных задач, AGI относится к машинам, способным понимать, обучаться и применять интеллект для решения любых проблем — подобно человеку.
Если вам доводилось общаться с ChatGPT от OpenAI или Claude от Anthropic или, тем более, использовать их в работе, вы уже имеете общее представление о том, как гипотетически должен работать AGI. Он должен обладать подобием сознания, понимать запросы человека в любой форме, адекватно реагировать на быстро меняющиеся ситуации и быть полезным во всем.
Стремление к AGI сулит революционные изменения во всех отраслях, от здравоохранения до финансов, но также поднимает глубокие этические и экзистенциальные вопросы. Например, тотальной безработицы.
Но как должен функционировать AGI и являются ли большие языковые модели, такие как ChatGPT (очень грубо, их суть в том, что благодаря обучению на больших массивах текстов и данных они могут точно предсказывать, каким должно быть следующее слово в предложении или предложение в тексте) прообразом AGI?
Вот тут мнения исследователей и разработчиков расходятся. Причем, довольно сильно.
Некоторые считают, что в основе AGI лежит стремление воспроизвести в машинах весь спектр когнитивных способностей человека.
Доктор Бен Гертцель, генеральный директор SingularityNET и одна из ведущих фигур в области исследований AGI, описывает AGI как создание машин, способных выполнять любые интеллектуальные задачи, которые под силу человеку. Это означает, что система AGI будет не просто преуспевать в одной области, а обладать способностью к адаптации и пониманию, чтобы решать различные задачи, учиться на новом опыте и даже проявлять творческие способности. Ей должно быть под силу самостоятельное обучение в сфере, в которой ее заранее не тренировали на больших массивах данных.
В то же время Сэм Альтман в своей прошлогодней колонке для The New Yorker описал AGI как «эквивалент среднего человека, которого вы могли бы нанять в качестве сослуживца».
Забавно, но при этом в документации OpenAI концепция AGI описывается несколько иначе — как «высокоавтономные системы, превосходящие человека в наиболее экономически выгодной работе».
В проектах OpenAI описывается пять уровней прогресса на пути к AGI. Первый уровень — это чат-боты (такие, как ChatGPT первых поколений), и это уровень уже пройден. На втором урове — разумные существа (здесь речь идет уже о таком уровне как последная модель ChatGPT o1, превью которой уже доступно для платных пользователей сервиса).
На третьему и четвертом уровне будут более современные агенты-инноваторы, способные не только обслуживать запросы, но и изобретать вещи и создавать проекты). И последний уровень — организационный, это будет ИИ, который может выполнять работу целой организации.
Стремление к созданию AGI подпитывается потенциальными преимуществами, которые он может принести. В здравоохранении AGI может произвести революцию в диагностике и персонализированной медицине, синтезируя огромные массивы медицинских данных для выявления закономерностей, которые не под силу человеку. В экологии он может моделировать сложные климатические системы, чтобы лучше предсказывать и смягчать последствия изменения климата.
Доктор Демис Хассабис, соучредитель и генеральный директор DeepMind, считает, что AGI может помочь решить некоторые из самых насущных проблем человечества. И будет доступен примерно к 2030 году.
Однако, не все ученые считают, что такой подход описывает AGI. Все описанные выше задачи все еще являются проявлениями «узкого» ИИ, пусть и с довольно широкими возможностями.
Например, Фей-Фей Ли, «крестная мать ИИ», настроена довольно скептично. Ли знает про ИИ больше многих.
«Я пришла из академического ИИ и была воспитана на более строгих и основанных на доказательствах методах, поэтому я не очень понимаю, что означают все эти слова», — сказала Ли в ответ на вопрос, когда мы достигнем AGI и «сингулярности ИИ» (так часто называют гипотетический момент, когда ИИ станет сравним с человеком по интеллекту).
«Я, честно говоря, даже не знаю, что означает AGI, — добавила Ли. — Как говорят люди, вы узнаете это, когда увидите, но я, похоже, этого не видела. По правде говоря, я не трачу много времени на обдумывание этих слов, потому что, на мой взгляд, есть много более важных дел».
Ли намекает, что процесс создании совершенного ИИ все еще находится на зачаточном этапе.
И это при том, что для нее, в отличие от многих исследователей, которые присоединились к гонке лишь недавно, все это длится уже два десятилетия.
В 2006 году она создала ImageNet, первый в мире большой набор данных для обучения и тестирования больших моделей, который стал катализатором нынешнего бума ИИ.
С 2017 по 2018 год она занимала должность главного научного сотрудника по ИИ в Google Cloud. Сегодня Ли возглавляет Стэнфордский институт человекоцентрированного ИИ, а также запустила собственный стартап World Labs.
По словам Ли, в основе всех нынешних разработок стоят три фактора — наука о больших данных (Big Data), развитие самообучающихся нейронных сетей и вычислительные мощности графических процессоров, на которых построены современные модели ИИ.
Но этого мало.
Ли считает, что"пространственный интеллект" нужно приблизить к реальности. И на это уйдет какое-то время. Ведь по ее словам, на развитие человеческого языка, на котором основаны современные большие языковые модели, ушел, вероятно, миллион лет. Ну а развитие зрения и восприятия, скорее всего, заняли более 500 млн лет.
А мы намерены втиснуть создание AGI в пару десятилетий.
«Нужно не просто заставить компьютеры видеть, а заставить их понимать весь трехмерный мир, что я называю пространственным интеллектом», — говорит Ли.
Илон Маск смотрит на вещи гораздо более оптимистично. Возможности новых моделей ИИ превзойдут человеческий разум уже к концу 2025 года, считает он. А полный AGI будет достигнут к 2029 году.
Маск, когда-то стоявший у истоков OpenAI, а потом разошедшийся во взглядах с Альтманом и другими учредителями, сегодня активно развивает Grok. Этот ИИ интегрирован в принадлежащую Маску соцсеть X (бывший Twitter), и доступен по подписке.
По словам Маска, сейчас обучение моделей ИИ затрудняется нехваткой передовых чипов. В одном из недавних интервью Маск рассказывал, что модель Grok 2, которая по его мнению, во всем превосходит GPT-4 компании OpenAI, нуждается в огромных вычислительных мощностях. Для обучения Grok 2 потребовалось около 20 000 чипов Nvidia H100, а для более совершенной Grok 3 их необходимо около 100 000.
Маск также считает, что на пути к созданию AGI стоит такая преграда, как нехватка электроэнергии. Экологи уже бьют тревогу, подсчитывая, что один запрос к ChatGPT уже потребляет больше энергии, чем поисковый запрос в Google. И в целом индустрия ИИ уже превосходит по энергопотреблению майнинг биткоина. Маск предлагает заранее предусмотреть пути решения энергетических проблем на пути к AGI.
Grok много в чем уступает ChatGPT и Claude, но у него уже есть своя фанатская база, и довольно большая. Маск сделал Grok максимально свободным от политкорректности, которая, по его мнению, «душит» другие варианты ИИ.
И это выводит на еще один виток разговора о достижимости AGI.
Ведь ИИ — это не только вычислительные способности, это еще и набор определенных ценностей. Учитывая, какой мощью будет он будет обладать, крайне важно, чтобы эта мощь применялась исключительно в благих целях. Многие ученые предостерегают от чересчур быстрого прогресса в этой сфере, например, такой точки зрения придерживался покойный Стивен Хокинг. Он говорил, что достигший сингулярности ИИ может привести к гибели человечества.
Эту точку зрения разделяют многие. Так, профессор Стюарт Рассел из Калифорнийского университета в Беркли изучает стратегии согласования ИИ, чтобы системы AGI действовали с пользой для человечества. По мнению Рассела, включение этических аспектов в процесс разработки для снижения рисков не менее важно, чем другие технологические аспекты создания ИИ.
Ну а по состоянию на текущий момент прийти к согласию по ключевым вопросам этических аспектов представляется весьма непростой задачей. Так, к примеру, созданный в недрах OpenAI графический ИИ DALL-E отказывается рисовать политические карикатуры на Дональда Трампа и Камалу Харрис. В то время как Grok Илона Маска делает это с легкостью.
И у того, и у другого ИИ — масса довольных и благодарных пользователей.
Особое мнение Apple
В то время, как все вокруг восхищаются существующими моделями генеративного ИИ, а ученые ломают копья относительно того, что такое AGI, и как нам его достичь, несколько обособленную позицию занимает компания Apple.
Несмотря на то, что ее со-основателя и многолетнего руководителя Стива Джобса уже давно нет с нами, Apple все еще словно бы живет по его заветам. Одним из них было отсутствие спешки в погоне за конкурентами. Многие помнят, как Джобс не спешил интегрировать некоторые функции в айфон, приговаривая «мы не первые, но мы будем лучшими».
Под управлением Тима Кука компания часто действует в том же духе. В то время, как остальные техногиганты активно интегрируют ИИ в свои продукты и сами ведут разработки, Apple никуда не спешит. Даже в новом iPhone 16 функции ИИ пока представлены в обрезанном виде и доступны далеко не всем пользователям.
Ну а тем временем Apple не ограничивает себя в критике существующих разработок в области ИИ.
Новое исследование, проведенное шестью инженерами Apple, показывает, что математические «рассуждения», демонстрируемые продвинутыми большими языковыми моделями, могут быть чрезвычайно ненадежными в некоторых совершенно тривиальных задачах.
Исследование показывает, что эти модели, мягко говоря, не очень «дружат» с математикой. Используя вероятностное сопоставление шаблонов, они порой демонстрируют полное непонимание базовых математических концепций.
Исследователи опробовали популярные модели генеративного ИИ на стандартизированном наборе GSM8K из более чем 8 000 математических задач школьного уровня, который часто используется в качестве эталона для тестирования вычислительных систем.
При этом они проверяли ИИ как на стандартных задачах, так с измененными заданиями, которые требуют переосмысления логики задачи.
Средняя точность ответов у современных ИИ была очень высока, например, последние модели ChatGPT получали более 90%. Но не обошлось без досадных казусов, которые в задачу о количестве киви, которое персонаж получает в течение нескольких дней было внесено дополнение, гласившее, что в один из дней киви были меньшего размера. ИИ с чистой совестью удалял более маленькие киви из уравнения, хотя в изначальных условиях не было ничего о том, что размер плода вообще имеет значение для общего подсчета.
Несмотря на то, что в работе исследователей из Apple вопрос о достижении AGI вообще напрямую не обсуждается, выводы в работе все же неутешительные.
Подобно некоторым другим исследованиям, работа Apple говорит о том, что большие языковые модели не способны выполнять формальные рассуждения. Они лишь имитируют их при помощи имеющихся в их обширных базах данных, которые максимально похожи на те, что запрашивает пользователь.
И если простенькая подсказка или изменение в условиях подталкивает к ходу рассуждений, который отличается от имеющихся шаблонов, имитация становится ошибочной.
«Нынешние большие языковые модели не способны к подлинным логическим рассуждениям, — заключают исследователи из Apple. — Вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в обучающих данных».
По мнению обозревателя Ars Technica Бенджа Эдвардса, это несколько меняет наше воспринятие текущего развития ИИ.
«Одна из причин, по которой GPT-4 от OpenAI вскружила голову в синтезе текста, — говорит Эдвардс. — Заключается в том, что модель наконец достигла такого размера, что поглотила достаточно информации (в обучающих данных), чтобы создать впечатление, что она может действительно понимать и моделировать мир, хотя на самом деле ключевым аспектом ее успеха является то, что она „знает“ гораздо больше, чем большинство людей, и может впечатлить нас, комбинируя эти существующие концепции новыми способами».
При наличии достаточного количества обучающих данных и вычислений индустрия ИИ, вероятно, достигнет того, что можно назвать «иллюзией понимания», — заключает Эдвардс.
По мнению Гэри Маркуса, эксперта в области ИИ, следующий большой скачок в возможностях ИИ произойдет только тогда, когда эти нейронные сети смогут интегрировать истинное «манипулирование символами, в котором некоторые знания представлены действительно абстрактно в терминах переменных и операций над этими переменными, как мы видим в алгебре и традиционном компьютерном программировании».
И пока этого не случилось, общаясь с большими языковыми моделями, мы будем получать такие хрупкие «рассуждения», которые могут привести к тому, что ИИ будет ошибаться в математических задачах, в которых никогда не ошибаются калькуляторы.
Тот ли это искусственный интеллект, о котором мечтательно говорит Фей-Фей Ли? Судя по всему, нет. И как сделать так, чтобы два этих видения встретились в реальности, пока никто точно сказать не может.