«Мозок» гуманоїдів. Чи вдасться Nvidia взяти під контроль світову робототехніку
Інновації6 січня, 20:00
Як пише TechCrunch, Nvidia, імовірно, прагне стати таким собі Android від світу роботів — платформою за замовчуванням, на якій сторонні розробники будуть масово розвивати власну техніку.
Свої розробки Nvidia узагальнює під терміном «фізичний ШІ». На відміну від звичайних чатботів, такий інтелект здатний сприймати реальний світ, розуміти його та планувати дії для машин у русі. У пресрелізі NVIDIA голова компанії Дженсен Хуанг назвав це «моментом ChatGPT для робототехніки».
Передплатіть NV Преміум та читайте без обмежень
Нам необхідна ваша підтримка, щоб займатися якісною журналістикою
«Прориви у фізичному штучному інтелекті […] відкривають абсолютно нові можливості для застосування», — додав засновник і генеральний директор NVIDIA.
«Повний набір процесорів Jetson для робототехніки, CUDA, Omniverse та відкриті фізичні ШІ-моделі від NVIDIA дають змогу нашій глобальній екосистемі партнерів трансформувати галузі за допомогою робототехніки на базі ШІ».
Історія лінійки Jetson розпочалася ще з 2014 році з плати Jetson TK1, надалі охопивши моделі TX1, TX2, Xavier та Nano. На початку 2020-х років модель під назвою Jetson AGX Orin відкрито позиціонували як робочу силу для робототехніки та систем ШІ.
Нині ж на ресурсах NVIDIA систему Jetson називають стандартною платформою для будь-якої машини, що потребує потужного ШІ, від рухомих складських платформ до антропоморфних роботів.
А партнери хто? У своєму релізі NVIDIA додає, що світові лідери галузі (Boston Dynamics, Caterpillar, Franka Robotics, Humanoid, LG Electronics, NEURA Robotics) уже використовують її робототехнічний стек для дебюту з новими роботами на базі ШІ.
Пропозиція Nvidia
На CES 2026 Nvidia показала родину моделей Cosmos. Зокрема Cosmos Transfer 2.5 та Cosmos Predict 2.5 — відкриті «моделі світу», які генерують синтетичні дані на основі законів фізики. Так можна перевірити поведінку роботів у віртуальній симуляції ще до того, як машина потрапить на склад.
Моделі вже доступні на платформі Hugging Face, тому дослідницьким лабораторіям не треба навчати власні гігантські системи з нуля. Cosmos уже дає роботам загальне розуміння світу, (подібне до того, як великі мовні моделі розуміють текст), але з опорою на дані сенсорів та 3D-простір.
Для ухвалення рішень Nvidia розробила Cosmos Reason 2. Це інтелектуальна зорово-мовна модель (VLM), яка допомагає машинам оцінювати оточення та обирати подальші дії у спосіб, що нагадує людський. Вона слугує «мозком» системи Isaac GR00T N1.6, створеної спеціально для людиноподібних роботів.
За описом NVIDIA Newsroom, завдяки Cosmos Reason модель GR00T дозволяє рóботу злагоджено керувати всім тілом: ходити, тримати баланс та взаємодіяти з предметами. З моделями GR00T та Cosmos уже працюють партнери NVIDIA: серед них — Franka Robotics, NEURA Robotics та стартап Humanoid.
Водночас компанія Salesforce тестує модель Cosmos Reason у своїй платформі Agentforce для аналізу відео з інцидентами на виробництві. В NVIDIA стверджують, що це дозволяє вдвічі швидше знаходити причини збоїв.
Для об'єктивного оцінювання успіхів ШІ Nvidia представила Isaac Lab-Arena — відкриту платформу для симуляцій, розміщену на GitHub. Замість того, щоб кожна лабораторія використовувала власні незрозумілі критерії, Lab-Arena пропонує спільні бібліотеки завдань, сценаріїв та метрик. Платформа сумісна з популярними тестовими наборами на кшталт Libero та RoboCasa.
Розробникам допомагатиме платформа OSMO — інструмент для масштабування складних обчислень фізичного ШІ. Принцип дії такий: інженер задає параметри для створення даних чи навчання моделі, а OSMO автоматично розподіляє завдання між хмарою та роботами на базі Jetson.
Nvidia зазначає, що ця система вже координує тисячі годин роботи графічних процесорів для внутрішніх проєктів і наразі інтегрується в інструментарій Microsoft Azure Robotics Accelerator.
Увесь цей софт потребує потужного заліза, тому на CES представили також новий модуль Jetson T4000 на архітектурі Blackwell. Він забезпечує обчислювальну потужність до 1200 терафлопс та має 64 ГБ пам’яті при споживанні 40−70 Вт.
На додачу Nvidia оголосила про поглиблення партнерства з платформою Hugging Face, інтегрувавши свої технології Isaac та GR00T у відкриту бібліотеку LeRobot. Мовляв, робототехніка зараз є категорією, що розвивається найшвидше на Hugging Face, а моделі та набори даних від Nvidia лідирують за кількістю завантажень.
«Ця співпраця об'єднує 2 мільйони розробників робототехніки NVIDIA з глобальною спільнотою Hugging Face, що складається з 13 мільйонів розробників ШІ», — заявляє компанія.
Конкуренція за роботів
Не факт, що саме Nvidia стане «Андроїдом» для робототехніки майбутнього. Так, перехід до реального виробництва вже розпочався: приміром, у жовтні торік агентство Reuters повідомляло про плани Foxconn розгорнути людиноподібних роботів на базі моделей GR00T на своєму заводі в Х’юстоні, де збирають сервери для Nvidia.
Але водночас Tesla та Figure розвивають власні системи, Google і Boston Dynamics роблять ставку на Gemini, а OpenMind узагалі пропонує платформу, не прив’язану до конкретного заліза.
Хоча, можливо, Nvidia і не обов’язково витісняти всіх конкурентів. Наприклад, Hyundai планує до 2028 року випускати по 30 тисяч роботів Atlas щорічно для власних заводів у США. За інформацією Axios, Hyundai співпрацює і з Google DeepMind, і з Nvidia для створення системи керування своїми машинами.
Якщо підхід Nvidia спрацює, більшість машин на заводах наступного десятиліття так чи інакше, бодай частково працюватимуть на базі її технологій.