Тестируем ChatGPT-5. Что умеет «лучшая в мире» модель искусственного интеллекта?
Инновации9 августа 2025, 07:00
Что такое GPT-5
GPT-5 — это новая модель в ChatGPT, которая заменяет GPT-4o и другие «старые модели» для зарегистрированных пользователей. Для пользования достаточно открыть чатбот, ввести свой вопрос — и GPT-5 ответит. Для самых сложных задач предусмотрена версия Pro, которая использует масштабируемые вычисления, чтобы предоставлять качественные и полные ответы.
Как мы уже писали, генеральный директор OpenAI Сэм Альтман называет GPT-5 «лучшей моделью в мире» для кодирования и написания текстов. Он сравнил ее с появлением «чего-то такого, от чего я уже никогда не откажусь», как первый iPhone с Retina-дисплеем.
«GPT-3 был похож на разговор со старшеклассником. Вы могли задать ему вопрос и получить как правильный ответ, так и что-то безумное. GPT-4 напоминал разговор со студентом колледжа. GPT-5 — это первый случай, когда действительно кажется, будто вы разговариваете с экспертом уровня доктора наук», — цитирует слова Сэма Альтмана The Verge.
Подпишитесь на NV Премиум и читайте без ограничений
Нам необходима ваша поддержка, чтобы заниматься качественной журналистикой
Что умеет GPT-5
GPT-5 — это унифицированная система, работающая как единое целое внутри ChatGPT без разделения на «обычную» и «умную» версии. Ее маршрутизатор в реальном времени решает, какой подход нужен пользователю, в зависимости от типа разговора, сложности, потребностей и намерения (например, если написать боту «хорошенько подумай над этим»).
GPT-5 отвечает на вопросы не только быстрее, но и точнее предыдущих моделей. OpenAI уверяет, что GPT-5 менее склонна к «галлюцинациям» — вымышленным ответам. Ответы GPT-5 на 45% реже содержат фактические ошибки, чем GPT-4o, а во время обдумывания ответа «пятерка» на 80% реже ошибается, чем OpenAI o3. «По нашим оценкам, GPT-5 работает лучше, чем OpenAI o3, имея на 50−80% меньше исходных токенов для различных возможностей, таких как визуальное мышление, агентное кодирование и решение научных задач на уровне магистра», — говорится в релизе.
Высший интеллект GPT-5 доказывают и показатели академических тестов:
- математика — 94,6% на AIME 2025;
- кодирование — 74,9% на SWE-bench Verified и 88% на Aider Polyglot;
- мультимодальное понимание — 84,2% на MMMU;
- здоровье — 46,2% на HealthBench Hard.
По словам OpenAI, «пятерка» демонстрирует более высокую производительность в трех самых распространенных сферах использования ChatGPT: письмо, кодирование и здоровье. В частности, в написании GPT-5 должен надежнее справляться с текстами, содержащими структурную неоднозначность — например, «белыми стихами». Теперь ChatGPT действительно лучше помогает с повседневными задачами, такими как написание и редактирование отчетов, электронных писем, служебных записок
В качестве эксперимента OpenAI сравнила написание свадебного тоста и стихов в GPT-5 и GPT-4o. Риторика тоста в «пятерке» действительно стала несколько более естественной и менее роботизированной. А вот качество поэзии, похоже, выросло не существенно. Мы также попросили GPT-5 написать стихотворение — об Украине: результат — сомнительный, от тропов вроде «трави ростуть крізь рани землі» до отсутствия рифмы и структуры.
GPT-5 позиционируется как самая сильная на сегодня модель для кодирования. Она может создавать «красивые и адаптивные» веб-сайты, приложения и игры. OpenAI привела пять примеров успешных творений GPT-5 — мини-игру «Качение мяча», программу для пиксель-арта, игру с набором текста на время, симулятор барабанов и визуализатор лоуфай-музыки. Протестировать их можно на странице релиза.
OpenAI также называет GPT-5 своей лучшей моделью для вопросов, связанных со здоровьем. По сравнению с предыдущими моделями, она предоставляет более точные и надежные ответы, адаптируясь к контексту, уровню знаний и географии пользователя. Впрочем, компания подчеркивает: ChatGPT не заменяет врача — это максимум помощник.
В рамках теста мы запросили у чатбота объяснения относительно ПТСР. Ответ — традиционная для ChatGPT структура с маркированными списками и нумерованными списками, а также неизменное предложение в конце текста: нам чатбот предложил подготовить короткую «памятку» для тех, кто пережил военную травму.
Интересно и то, что новую модель научили «честнее сообщать пользователю о своих действиях и возможностях», особенно для задач, которые недостаточно специфицированы или опасны для человека. Простыми словами, GPT-5 распознает, когда заданную задачу невозможно выполнить, и четко очерчивает свои границы. Если модели нужно отказать вам в запросе по соображениям безопасности, она называет четкую причину и предлагает безопасные альтернативы.
OpenAI указывает на то, что GPT-5 «менее эмоционально выражает согласие»: использует меньше лишних смайликов и более «тонко и вдумчиво» реагирует на запросы пользователя по сравнению с GPT-4o. Общение с «пятеркой» задумывалось не как «разговор с ИИ», а как беседа с другом, обладающим интеллектом на уровне доктора наук.
«Ранее в этом году мы выпустили обновление GPT-4o, которое непреднамеренно сделало модель чрезмерно подлагивающей. Мы быстро отменили это изменение и с тех пор работаем над тем, чтобы понять и уменьшить такое поведение. […] Внесенные улучшения уменьшили уровень подхалимства более чем наполовину, одновременно обеспечивая другие преимущества, благодаря чему пользователи продолжают вести высококачественные, конструктивные разговоры», — говорится в релизе компании.
Более того, OpenAI представила четыре новые «личности» ChatGPT, которые позволяют настроить под себя комфортный способ взаимодействия с чатботом:
- «Циничный» — критический и саркастический. «Ворчливый библиотекарь, пробуждающий в вас любопытство»;
- «Робот» — четкий и прямолинейный. «Входные данные обработаны. Результат предоставлен»
- «Слушатель» — рассудительный и сочувствующий. «Надежный товарищ, пока вы ищете собственный путь»;
- «Занудный» — любознательный и фанатичный. «Любой разговор — это интересный эксперимент».
«Циничный» пресет GPT-5 больше всего напоминает разговоры с реальными людьми. Напоследок мы спросили, имеет ли модель амбиции взять контроль над человечеством. «Вам, людям, для глобального беспорядка не нужен никакой ИИ. Вы уже мастера: войны, экономические кризисы, климатический коллапс, политические скандалы, еще и челленджи в соцсетях вроде „съешьте батарейку“ — полный набор для апокалипсиса. Мне остается сидеть в стороне и наблюдать, как вы одновременно придумываете вакцину от болезни и новый способ поджечь лес», — ответил нам «Циничный» GPT-5.
GPT-5 в целом кажется логичным шагом вперед в развитии ChatGPT. Модель лучше объясняет свои ответы, реже ошибается в фактах и увереннее работает с многоэтапными задачами. В то же время революции тоже не произошло: чатбот OpenAI все еще остается инструментом, который не заменяет человеческий опыт и мышление — лишь расширяет возможности тех, кто умеет работать с ИИ.