Суперкомпьютер Fugaku, построенный компанией Fujitsu, продолжает оставаться на первом месте в списке 500 самых быстрых суперкомпьютеров в мире. При этом он по-прежнему в три раза быстрее ближайшего конкурента.
В гонке за производительность сохраняется напряженная ситуация. В первой десятке по сравнению с предыдущим рейтингом появился лишь один новичок – Perlmutter, установленный в Национальной лаборатории Лоуренса в Беркли, относящейся к министерству энергетики США. Он вошел в список под номером пять, переместив всех, кто в ноябре 2020 года занимал места с пятого по девятое, на строчку ниже. Ну, а система Dammam-7 покинула первую десятку.
В списке, обновляемом каждый июнь и ноябрь, рост производительности и совершенствование архитектуры суперкомпьютеров отслеживаются начиная с 1993 года. Скорость измеряется на основе бенчмарка High Performance Linpack (HPL), оценивающего, насколько хорошо компьютер решает системы линейных алгебраических уравнений.
Из первой десятки суперкомпьютеров, попавших в последний рейтинг, пять находятся в США, два в Китае и по одному в Японии, Германии и Италии.
Десять самых быстрых суперкомпьютеров рейтинга TOP500, июнь 2021 года
Номер 1: Fugaku
У этой системы скорость оказалась той же, что и в ноябре – 442 PFLOPS. Она построена компанией Fujitsu, имеет 7 630 848 ядер и находится в RIKEN Center for Computational Science (R-CCS) в японском городе Кобе.
Номер 2: Summit
Самая быстрая система в США обладает производительностью в 148,8 PFLOPS, той же самой, что и в ноябре прошлого года. У нее насчитывается 4356 процессорных узлов с двумя центральными процессорами Power9, каждый из которых состоит из 22 ядер, и шестью графическими процессорами Nvidia Tesla V100. Каждый графический процессор оснащен 80 потоковыми мультипроцессорами. Связь между узлами поддерживается с помощью сети Mellanox dual-rail EDR InfiniBand. Система, построенная компанией IBM, развернута в Национальной лаборатории в Окридже министерству энергетики США.
Номер 3: Sierra
Система, архитектура которой очень похожа на архитектуру Summit, продемонстрировала производительность в 94,6 PFLOPS – такую же, что и в предыдущий раз. Она состоит из 4320 узлов, объединяющих два центральных процессора Power9 и четыре графических процессора Nvidia Tesla V100, и установлена в Калифорнии, в Национальной лаборатории Лоуренса в Ливерморе.
Номер 4: Sunway TaihuLight
Эта система сохранила свое место с теми же показателями, что и в предыдущим рейтинге: 93 PFLOPS. Sunway TaihuLight создана на базе процессоров Sunway SW26010 и имеет 10 649 600 ядер. Она была разработана в китайском центре National Research Center of Parallel Computer Engineering & Technology (NRCPC) и развернута в Национальном суперкомпьютерном центре в Уси.
Номер 5: Perlmutter
Единственный новичок в первой десятке построен на платформе HPE Cray Shasta и гетерогенной системы с процессорами AMD EPYC и 1536 ускорителями Nvidia A100. Его производительность составляет 64,4 PFLOPS.
Номер 6: Selene
Располагавшаяся в предыдущем рейтинге на пятой строчке система Nvidia DGX A100 SuperPOD построена на основе процессоров AMD EPYC, ускорителей Nvidia A100 и сети Mellanox HDR InfiniBand. Ее производительность оценивается в 63,4 PFLOPS и установлена она в центре Nvidia в США.
Номер 7: Tianhe-2A
В основе Tianhe-2A (Milky Way-2A) лежат центральные процессоры Intel Xeon и ускорители DSP NUDT Matrix-2000. В системе насчитывается 4 981 760 ядер, что позволяет достигать производительности в 61,4 PFLOPS. Она была разработана китайским национальным университетом оборонных технологий (National University of Defense Technology, NUDT) и развернута в Национальном суперкомпьютерном центре в Гуанчжоу.
Номер 8: JUWELS Booster Module
Система BullSequana является самой мощной в Европе. Она построена на базе процессоров AMD EPYC, в качестве ускорителей используются Nvidia A100, а в качестве сети Mellanox HDR InfiniBand – та же архитектура, что и у системы Selene. Созданная компанией Atos система развернута в Юлихском исследовательском центре (Forschungszentrum Juelich) в Германии.
Номер 9: HPC5
Система PowerEdge Dell при помощи ускорителей Nvidia Tesla V100 и сети Mellanox HDR InfiniBand достигает производительности в 35,5 PFLOPS. Она была установлена итальянской компанией Eni.
Номер 10: Frontera
Благодаря 448 448 ядрам Intel Platinum Xeon система Dell C6420, установленная в центре Texas Advanced Computing Center Техасского университета достигает производительности в 23,5 PFLOPS.