Гонка за господство в мире серверных GPU стала трехсторонней

За долю растущего рынка графических процессоров для машинного обучения и параллельных вычислений борются Nvidia, AMD и Intel.

Графические чипы, изначально созданные в качестве ускорителей для игр, со временем развились в серверные процессоры для систем высокопроизводительных вычислений и искусственного интеллекта. Они используются в суперкомпьютерах, финансовом моделировании, обработке медицинских изображений и даже могут заменять центральные процессоры в задачах, для которых тем не хватает быстродействия; существуют, к примеру, реляционные СУБД, работающие на GPU.

К двум ведущим производителям серверных графических процессоров, Nvidia и AMD, вскоре присоединится Intel. До этого она уже дважды предпринимала попытки предложить собственный GPU, но оба раза безуспешно.

В Nvidia объявили о текущих планах относительно GPU, анонсировав архитектуру Hopper, которая обеспечит в 3–6 раз более высокую производительность по сравнению с предыдущей Ampere. Сообщается, что быстродействие графического чипа Hopper H100 при работе с 64-разрядными числами (FP64) составит 60 TFLOPS. Этот GPU можно будет использовать на сервере отдельно в составе платы PCI Express или в паре со специальным центральным процессором Grace архитектуры ARM, который в Nvidia планируют выпустить в 2023 году.

Для Hopper в компании также доработали память LPDDR5, обеспечив поддержку кода коррекции ошибок и удвоив пропускную способность по сравнению с обычной DDR5. Вместе с Hopper анонсирована технология межсоединений NVLink 4, которая позволяет напрямую связать два GPU, чтобы они смогли обмениваться данными на скорости, впятеро большей, чем у шины PCIe Gen5. Поставки Hopper планируется начать в третьем квартале.

Поскольку партнер Nvidia, крупнейший в мире контрактный производитель микросхем, компания TSMC продолжает испытывать дефицит производственных мощностей, в Nvidia допустили возможность сотрудничества с Intel, у которой есть свои полупроводниковые заводы в США и других странах, но отмечено, что такая сделка может быть заключена не скоро, возможно, лишь через несколько лет.

AMD, в свою очередь, с первого квартала поставляет Instinct MI250 — линейку серверных ускорителей вычислений на базе GPU, значительно более быстрых по сравнению с предыдущей серией MI100. Быстродействие MI250 в режиме FP64 достигает 47,9 TFLOPS.

Интерес к Instinct может быть подогрет благодаря успеху серверных центральных процессоров AMD Epyc, которого компания добилась за последнее время. На сегодня Instinct уже применяется в суперкомпьютере Окриджской национальной лаборатории, который отличается высоким быстродействием при довольно компактных размерах. Для той же организации целиком на основе продукции AMD строится экзафлопсный суперкомпьютер Frontier, который введут в эксплуатацию в этом году.

Что касается Intel, которой долгое время не удавалось привлечь внимание к своим GPU, не считая видеочипы базового уровня, встроенные в центральные процессоры, сегодня она предлагает линейку дискретных графических ускорителей Intel Xe, а также готовит серверный вариант такого GPU под кодовым именем Ponte Vecchio. Его быстродействие в режиме FP64 составит 45 TFLOPS. При этом в Intel сообщают о широчайших возможностях масштабирования Ponte Vecchio.

Кроме того, в Intel работают над oneAPI — платформой разработки программного обеспечения, которая при компиляции автоматически будет выбирать самый подходящий тип процессора среди выпускаемых Intel, к числу которых относятся чипы x86, графические процессоры, программируемые матрицы FPGA и ускорители задач искусственного интеллекта. Таким образом, разработчику не придется самостоятельно выбирать определенный процессор и писать код конкретно для него. В составе платформы также будут предусмотрены готовые библиотеки и функции для задач, касающихся аналитики, связи, работы с видео и нейронными сетями. OneAPI избавит от необходимости использования разных инструментов, библиотек и языков программирования — бизнес-логику можно будет писать на Data Parallel C++ (DPC++), диалекте C++ с открытым кодом, специально предназначенном для параллельной обработки данных и создания ПО для гетерогенных систем.