Умнее многих людей. Новая ИИ-модель OpenAI показала потрясающий результат в авторитетном IQ-тесте
Модель искусственного интеллекта o1 от OpenAI превзошла всех конкурентов в авторитетном норвежском IQ-тесте Mensa.
Модель o1 правильно ответила на 25 из 35 вопросов IQ-теста. В нем использовались вопросы, которые никогда не публиковались в Интернете, к которому имеют доступ поисковые системы. Этот результат позволил модели набрать 120 баллов IQ. Для сравнения, модель искусственного интеллекта Claude от Anthropic смогла бы достичь такого результата только через 1,5−2,5 года.
«Claude-1 … дал 6 правильных ответов, что дало примерно 64 IQ. Клод-2 набрал 6 дополнительных баллов за тест (примерно 18 баллов IQ). Claude-3 набрал еще 6,5 баллов, что стоит еще примерно на 19 баллов IQ, и что превышает средний показатель для человека. ... Очень простая экстраполяция предполагает, что мы должны ожидать Claude-4 через 12−16 месяцев, и что он должен отвечать примерно на 25 вопросов теста», — пишет исследователь искусственного интеллекта Макс Лотт, который провел тестирование новой модели.
Самый сложный тест, который прошла o1, включает анализ шаблонов и способность идентифицировать недостающие элементы в сетке. Модель продемонстрировала усовершенствованное понимание геометрических узоров. Несмотря на некоторые ошибки в похожих типовых вопросах, o1 показала, что OpenAI достигла значительного прогресса в разработке высокопроизводительного ИИ. Результат теста также позволяет предположить, что в ближайшие годы ИИ превысит отметку 140 баллов IQ.