Почти человеческое воображение. OpenAI научила ИИ рассуждать изображениями

IT-индустрия

17 апреля 2025, 22:55

OpenAI выпустила две новые модели искусственного интеллекта — o3 и o4-mini. Обе могут интегрировать изображения в свою цепочку мыслей.

OpenAI называет o3 своей «самой мощной моделью мышления», а o4-mini — меньшей и более быстрой моделью, которая достигает превосходной производительности для своего размера и стоимости. Компания говорит, что o3 и o4-mini смогут «мыслить» с помощью изображений, интегрируя изображения в свою цепочку мыслей. Это может быть полезным, если вы показываете моделям такие вещи как эскизы. OpenAI говорит, что модели также смогут корректировать изображения, увеличивая их или вращая изображения «в рамках процесса рассуждения».

Кроме того, OpenAI заявляет, что эти модели рассуждений смогут использовать все существующие инструменты ChatGPT.

«Впервые наши модели рассуждений могут агентно использовать и сочетать все инструменты в ChatGPT — это включает поиск в Интернете, анализ загруженных файлов и других данных с помощью Python, глубокое рассуждение о визуальном вводе и даже генерирование изображений. Самое важное то, что эти модели обучены размышлять о том, когда и как использовать инструменты для получения подробных и продуманных ответов в правильных выходных форматах, как правило, менее чем за минуту, для решения более сложных проблем. Это позволяет им эффективнее решать многогранные вопросы, что является шагом к более активному ChatGPT, который может самостоятельно выполнять задачи от вашего имени», — отмечают в OpenAI.

Новые модели уже доступны для пользователей с подписками ChatGPT Plus, Pro и Team. Пользователи ChatGPT Enterprise и Edu получат доступ через неделю.

Напомним, накануне OpenAI представила свою флагманскую модель искусственного интеллекта GPT-4.1. Также OpenAI объявила, что скоро прекратит использование модели искусственного интеллекта GPT-4, из-за которой компанию обвиняли в нарушении авторских прав.

Другие новости

Все новости