Обучает модели за несколько недель. Microsoft создала первую суперфабрику искусственного интеллекта

14 ноября, 10:30
Сделать резюме статьи:
ChatGPT ChatGPT
Центр обработки данных Fairwater AI компании Microsoft в Fairwater AI (Фото: Microsoft)

Центр обработки данных Fairwater AI компании Microsoft в Fairwater AI (Фото: Microsoft)

Американская компания Microsoft запустила свой первый кластер дата-центров нового поколения — «AI суперфабрику», которая может обучать большие модели искусственного интеллекта не за месяцы, а всего за несколько недель.

Компания соединила два своих крупных дата-центра в штатах Висконсин и Атланта. Они образуют единую систему, работающую как один мощный вычислительный комплекс. Такие центры получили название Fairwater.

Реклама

«Мы создаем распределенную сеть, которая действует как виртуальный суперкомпьютер, чтобы решать самые сложные проблемы в мире. Это невозможно сделать на одном объекте», — пояснил Алистер Спирс, генеральный менеджер Microsoft по инфраструктуре Azure.

Современные модели искусственного интеллекта становятся все больше и больше. Каждое новое поколение имеет триллионы параметров — это внутренние настройки, которые помогают системам «понимать» информацию и давать точные ответы.

Обычные дата-центры уже не могут справиться с таким объемом вычислений. Fairwater-центры работают как один распределенный механизм, где каждая площадка выполняет часть большой задачи.

Благодаря этому можно тренировать модели, содержащие сотни триллионов параметров — объем, который традиционные центры не способны обработать.

«Обычный дата-центр обслуживает тысячи приложений для разных клиентов. А здесь мы запускаем одну сложную задачу на миллионах устройств. Это настоящая фабрика искусственного интеллекта», — рассказал Спирс.

Fairwater-центры используют системы NVIDIA GB200 NVL72, которые можно масштабировать до сотен тысяч графических процессоров NVIDIA Blackwell. Они имеют двухэтажную конструкцию, позволяющую разместить больше оборудования, и систему жидкостного охлаждения, которая требует минимум воды.

Вице-президент Microsoft по направлению Cloud + AI Скотт Гатри отметил, что главное не просто увеличивать количество процессоров, а создавать инфраструктуру, которая заставляет их работать как единую систему.

Microsoft планирует соединить будущие центры через собственную AI Wide Area Network (AI WAN) — систему оптоволоконных кабелей, которая обеспечит передачу данных на скорости света без задержек.

Компания инвестирует значительную часть из своих 34 миллиардов долларов капитальных затрат в развитие дата-центров и графических процессоров.

Похожие шаги делают и конкуренты — Amazon, Google, Meta, OpenAI и Anthropic — которые тратят десятки миллиардов долларов на создание собственных вычислительных систем.

Несмотря на опасения некоторых аналитиков относительно «AI-пузыря», в Microsoft утверждают, что спрос реален и превышает текущие возможности поставки.

Показать ещё новости