Суперразум уже рядом. В OpenAI ищут способы обуздать сверхчеловеческий искусственный интеллект

15 декабря 2023, 09:14

Автор: Анастасия Печенюк

OpenAI сформировала команду Superalignment для разработки способов управления сверхразумными системами искусственного интеллекта, которые бы, в теории, имели способности, превышающие человеческие.

В OpenAI предполагают, что появление суперинтеллекта — не такая уж далекая перспектива. Поэтому команда Superalignment уже сейчас пытается создать структуру управления и контроля, которая могла бы применяться для будущих мощных систем ИИ.

«Прогресс ИИ в последнее время был чрезвычайно быстрым, и я могу вас заверить, что он не замедляется. Я думаю, что мы достигнем систем человеческого уровня довольно скоро. Но это не остановится на достигнутом — мы пойдем прямо к сверхчеловеческим системам… Итак, как мы будем выравнивать сверхчеловеческие системы искусственного интеллекта и делать их безопасными? Это действительно проблема всего человечества — возможно, самая важная нерешенная техническая проблема нашего времени», — отметил член команды Superalignment Леопольд Ашенбреннер в комментарии TechCrunch,

Подход, на котором сейчас остановилась команда, предполагает использование более слабой, менее сложной модели искусственного интеллекта (например, GPT-2) для того, чтобы направить более продвинутую, сложную модель (GPT-4) в желаемом направлении.

«Мы пытаемся сказать модели, что делать, и убедиться, что она это сделает. Как заставить модель выполнять инструкции и помогать только правдивым вещам, а не выдумывать? Как заставить модель сообщить нам, является ли сгенерированный ею код безопасным или это вопиющее поведение? Это типы задач, которые мы хотим решить с помощью наших исследований», — рассказал Колин Бернс из Superalignment.

Настроенная командой Superalignment слабая модель генерирует метки, которые используются для «общения» с сильной моделью. Учитывая сообщения от слабой модели, сильная модель может обобщать данные более или менее правильно, в соответствии с намерениями слабой модели, утверждает команда.

Но эта система не идеальна, поэтому OpenAI также стремится запустить грантовую программу в размере 10 миллионов долларов США для академических лабораторий, некоммерческих организаций, отдельных исследователей и аспирантов. Презентовать результаты работы планируют на конференции в начале 2025 года. Команда Superalignment заверила, что информация об этой работе и получателях грантов от OpenAI за исследования, связанные с укрощением ИИ, в конце концов будут обнародованы.

Для исследований команды Superalignment выделено значительное количество вычислительных ресурсов OpenAI — около 20% имеющихся компьютерных чипов. А возглавляет усилия команды Superalignment, сформированной этим летом, сооснователь и главный научный сотрудник OpenAI Илья Суцкевер. Как писал NV Техно, накануне вышел документальный фильм, в котором Суцкевер публично предупредил, что технология, которую создает его компания, изменит мир и, возможно, в плохую сторону. По его словам, в будущем ИИ будет относиться к людям как к животным.

Войти