Битва техногигантов. Google представила свою версию суперумного голосового помощника — видео

Инновации

15 мая 2024, 17:01

Google представила мультимодального ассистента с искусственным интеллектом Project Astra. Он может видеть мир в реальном времени и распознавать объекты.

Генеральный директор Google DeepMind Демис Хасабис в блоге Google заявил, что компания «всегда хотела разработать универсальных агентов искусственного интеллекта, которые могут быть полезными в повседневной жизни».

«Опираясь на Gemini, мы разработали прототип агентов, которые могут быстрее обрабатывать информацию путем непрерывного кодирования видеокадров, объединения видео и речевого ввода во временную шкалу событий и кэширования этой информации для эффективного отзыва. Используя наши ведущие речевые модели, мы также улучшили их звучание, предоставив агентам более широкий диапазон интонаций. Эти агенты могут лучше понимать контекст, в котором они используются, и быстро реагировать в разговоре», — рассказал он.

Часть таких разработок — умный помощник Project Astra, презентованный на событии Google I/O. Компания провела видео демонстрацию Project Astra и назвала его системой, «отражающей видение будущего помощников искусственного интеллекта Google DeepMind». На видео изображена женщина, которая взаимодействует с агентом с искусственным интеллектом через приложение на телефоне и в очках Google. Она задает вопросы о вещах в ее окружении, и агент быстро отвечает. К примеру, рассказывает, что делает продемонстрированный компьютерный код, разгадывает ребус, предоставляет справку о локации, помогает найти потерянный предмет и тому подобное. Компания утверждает, что каждая часть была снята за один дубль в режиме реального времени.

«С подобными технологиями легко представить будущее, где люди смогут иметь экспертного помощника с искусственным интеллектом через телефон или очки. И некоторые из этих возможностей появятся в продуктах Google, таких, как приложение Gemini и веб-интерфейс, позже в этом году», — говорит Хасабис.

Демонстрация Project Astra совпала по времени с громким анонсом от OpenAI, которая выпустила новую модель искусственного интеллекта GPT-4o, поддерживающую разговор с использованием видеосвязи и способную выполнять роль умного голосового помощника. В отличие от предыдущих выпусков, эта более мощная модель с самого начала доступна для всех пользователей ChatGPT.

Другие новости

Все новости