News

Публикации
	2023 г. – новый этап практического применения CXL, статья
	VMware сдвигает акцент в проекте Capitola на CXL, статья
	Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
	OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
	Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
	UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
	Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
	GigaIO: CDI_решение на базе AMD для высшего образования, статья
	Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
	От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
	EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
	LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
	End-to-end 64G FC NAFA, статья
	Computational Storage, статья
	Технология KIOXIA Software-Enabled Flash™, статья
	Pavilion: 200 млн IOPS на стойку, статья
	CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
	Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
	Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
	SmartNIC – новый уровень инфраструктурной обработки, статья
	Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
	Compute, Memory и Storage, статья
	Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
	Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
	Intel® Agilex™ FPGA, статья
	Weka для AI-трансформации, статья
	Cloudera Data Platform – “лучшее из двух миров”, статья
	Fujitsu ETERNUS DSP - разработано для будущего, статья
	Технологии охлаждения для следующего поколения HPC-решений, статья
	Что такое современный HBA?, статья
	Fugaku– самый быстрый суперкомпьютер в мире, статья
	НРС – эпоха революционных изменений, статья
	Новое поколение СХД Fujitsu ETERNUS, статья
	Зональное хранение данных, статья
	За пределами суперкомпьютеров, статья
	Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
	Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
	DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
	IPsec в пост-квантовую эру, статья
	LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья

Обзоры
	Все обзоры в Storage News

Тематические публикации
	Flash-память
	Облачные вычисления/сервисы
	Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
	Современные СХД
	Информационная безопасность (ИБ), борьба с мошенничеством
	Рынки

Frontier ORNL первой преодолела экзафлопсный порог

30, май 2022 — 59-е издание рейтинга TOP500 показало , что система Frontier является первой настоящей эксафлопсной машиной с показателем HPL 1,102 экзафлоп/с.

Первое место в настоящее время занимает система Frontier Национальной лаборатории Ок-Ридж (ORNL) в США. Основанная на новейшей архитектуре HPE Cray EX235a и оснащенная процессорами AMD EPYC 64C с тактовой частотой 2 ГГц, система имеет 8 730 112 ядер, рейтинг энергоэффективности 52,23 гигафлопс/ватт и использует гигабитный Ethernet ( в новых системах используется HPE Slingshot 11, работающий поверх Ethernet уровня 3, https://www.servethehome.com/hpe-and-amd-powered-frontier-tops-the-top500-ushering-in-exascale/ ) для передачи данных.

Одна стойка может содержать 64 блейдов и 512 процессоров. Каждый блейд может поддерживать несколько поколений CPU , GPU и интерконнекта. Поддерживается 100% водяное охлаждение (85 o F ). Система может масштабироваться до сотен стоек.

Недавнее усовершенствование системы Frontier позволило машине преодолеть барьер в 1 экзафлопс. Обладая точным показателем HPL 1,102 экзафлоп/с, Frontier является не только самым мощным из когда-либо существовавших суперкомпьютеров, но и первой настоящей экзафлопсной машиной.

Ранее первое место в течение двух лет подряд занимала система Fugaku в Центре вычислительных наук RIKEN (R-CCS) в Кобе, Япония. Придерживаясь своего предыдущего эталонного показателя HPL, равного 442 PFlop/s, Fugaku теперь опустилась на 2-е место. Учитывая тот факт, что теоретический пик Fugaku превышает барьер в 1 экзафлоп, есть основания также называть эту систему экзафлопной машиной. Однако Frontier — единственная система, способная продемонстрировать это в тесте производительности HPL.

Еще одним изменением в TOP10 стало внедрение системы LUMI в EUROHPC/CSC в Финляндии. Теперь эта новая система, занимающая третье место, имеет 1 110 144 ядра и имеет показатель HPL почти 152 PFlop/s. LUMI также примечателен тем, что это самая большая система в Европе.

Наконец, еще одно изменение в TOP10 произошло на месте № 10 с новым добавлением системы Adastra в GENCI-CINES во Франции. Он достиг показателя HPL 46,1 Пфлоп/с и является вторым по мощности компьютером в Европе после LUMI.

Вот краткое изложение системы в Top10:

Frontier — новая система №1 в TOP500. Эта система HPE Cray EX — первая система в США, пиковая производительность которой превышает один ExaFlop/s. В настоящее время он интегрируется и тестируется в ORNL в Теннесси, США, где он будет эксплуатироваться Министерством энергетики (DOE). В настоящее время он достиг 1,102 экзафлоп/с, используя 8 730 112 ядер. Новая архитектура HPE Cray EX сочетает в себе процессоры AMD EPYC™ 3-го поколения, оптимизированные для высокопроизводительных вычислений и искусственного интеллекта, ускорители AMD Instinct™ 250X и межсоединение Slingshot-11.
Fugaku, теперь система № 2, установлена в Центре вычислительных наук RIKEN (R-CCS) в Кобе, Япония. Он имеет 7 630 848 ядер, что позволило ему достичь показателя HPL в 442 Пфлоп/с. Это ставит ее в 3 раза впереди системы № 3 в списке.
Новая система LUMI, еще одна система HPE Cray EX, установленная в центре EuroHPC в CSC в Финляндии, занимает третье место с производительностью 151,9 Пфлоп/с, опережая четвертое место. Европейское совместное предприятие по высокопроизводительным вычислениям (EuroHPC JU ) объединяет европейские ресурсы для разработки первоклассных экзафлопсных суперкомпьютеров для обработки больших данных. Один из панъевропейских суперкомпьютеров до экзафлопса, LUMI, находится в центре обработки данных CSC в Каяани, Финляндия.
Summit, система, созданная IBM в ORNL в Теннесси, США, теперь занимает 4-е место в мире с производительностью 148,8 Пфлоп/с в эталонном тесте HPL, который используется для ранжирования списка TOP500. Summit состоит из 4356 узлов, каждый из которых содержит два процессора Power9 с 22 ядрами и шесть графических процессоров NVIDIA Tesla V100, каждый из которых имеет 80 потоковых мультипроцессоров (SM). Узлы связаны между собой двухканальной сетью Mellanox EDR InfiniBand.
Sierra, система в Ливерморской национальной лаборатории им. Лоуренса, Калифорния, США, находится на пятом месте. Ее архитектура очень похожа на системный саммит №4. Он состоит из 4320 узлов с двумя процессорами Power9 и четырьмя графическими процессорами NVIDIA Tesla V100. Sierra достигла 94,6 Пфлоп/с.
Sunway TaihuLight — это система, разработанная Национальным исследовательским центром параллельных вычислений и технологий Китая (NRCPC) и установленная в Национальном суперкомпьютерном центре в Уси, провинция Цзянсу, Китай.
Perlmutter под номером 7 основан на платформе HPE Cray «Shasta» и гетерогенной системе с узлами на базе AMD EPYC и 1536 узлами с ускорением NVIDIA A100. Перлмуттер достиг 64,6 Пфлоп/с
Сейчас Selene занимает 8-е место в списке NVIDIA DGX A100 SuperPOD, установленном в компании NVIDIA в США. Система основана на процессоре AMD EPYC с NVIDIA A100 для ускорения и Mellanox HDR InfiniBand в качестве сети и достигает 63,4 Пфлоп/с.
Tianhe-2A (Milky Way-2A), система, разработанная Национальным университетом оборонных технологий Китая (NUDT) и развернутая в Национальном суперкомпьютерном центре в Гуанчжоу, Китай, теперь указана как система № 9 с производительностью 61,4 Пфлоп/с.
Система Adastra, установленная в GENCI-CINES, является новой в списке и занимает 10-е место. Это третья новая система HPE Cray EX и вторая по скорости система в Европе. Он достиг 46,1 Пфлоп / с.

Место	Система	ядра	Rmax (Пфлоп/с)	Rpeak (PFlop/s)	Мощность (кВт)
1	Frontier — HPE Cray EX235a, AMD Optimized EPYC 64C 3- го поколения 2 ГГц , AMD Instinct MI250X, Slingshot-11, HPE DOE/SC/Oak Ridge National Laboratory США	8 730 112	1 102,00	1685,65	21 100
2	Суперкомпьютер Fugaku - Суперкомпьютер Fugaku, A64FX 48C 2,2 ГГц, межсоединение Tofu D, Центр вычислительных наук Fujitsu Япония	7 630 848	442.01	537,21	29 899
3	LUMI — HPE Cray EX235a, AMD Optimized EPYC 64C 3-го поколения, 2 ГГц, AMD Instinct MI250X, Slingshot-11, HPE EuroHPC/CSC , Финляндия	1 110 144	151,90	214,35	2942
4	Саммит — IBM Power System AC922, IBM POWER9 22C 3,07 ГГц, NVIDIA Volta GV100, двухканальный Mellanox EDR Infiniband, IBM DOE/SC/Oak Ridge National Laboratory США	2 414 592	148,60	200,79	10 096
5	Sierra — IBM Power System AC922, IBM POWER9 22C 3,1 ГГц, NVIDIA Volta GV100, двухканальный Mellanox EDR Infiniband, IBM / NVIDIA / Mellanox DOE/NNSA/LLNL США	1 572 480	94,64	125,71	7438
6	Sunway TaihuLight - Sunway MPP, Sunway SW26010 260C 1,45 ГГц, Sunway, Национальный суперкомпьютерный центр NRCPC Китай	10 649 600	93.01	125,44	15 371
7	Perlmutter — HPE Cray EX235n, AMD EPYC 7763 64C 2,45 ГГц, NVIDIA A100 SXM4 40 ГБ, Slingshot-10, HPE DOE/SC/LBNL/NERSC США	761 856	70,87	93,75	2589
8	Selene — NVIDIA DGX A100, AMD EPYC 7742 64C 2,25 ГГц , NVIDIA A100, Mellanox HDR Infiniband, Nvidia NVIDIA Corporation США	555 520	63,46	79,22	2646
9	Tianhe-2A - Кластер TH-IVB-FEP, Intel Xeon E5-2692v2 12C 2,2 ГГц, TH Express-2, Matrix-2000, Национальный суперкомпьютерный центр NUDT Китай	4 981 760	61,44	100,68	18 482
10	Adastra — HPE Cray EX235a, AMD Optimized EPYC 64C 3- го поколения , 2 ГГц , AMD Instinct MI250X, Slingshot-11, HPE Grand Equipement National de Calcul Intensif — Centre Informatique National de l'Enseignement Suprieur (GENCI-CINES), Франция	319 072	46.10	61,61	921

22	Chervonenkis - YANDEX Y4N-GA1-TY25-ZB0, AMD EPYC 7702 64C 2GHz, NVIDIA A100 80GB, Infiniband, YANDEX, NVIDIA Yandex Russia	193,440	21.53	29.42

Другие особенности ТОП500

Опять же, процессоры AMD кажутся предпочтительной технологией для систем HPC. Frontier использует процессоры AMD EPYC 3-го поколения, оптимизированные для высокопроизводительных вычислений и искусственного интеллекта. Система LUMI № 3 также использовала процессоры AMD EPYC 3-го поколения, в то время как Permutter № 7 использовала процессоры AMD EPYC 7763, а Selene № 8 использовала процессоры AMD EPYC 7742.

Еще один момент, напоминающий о самых последних списках TOP500, заключается в том, что Китай и Соединенные Штаты являются двумя странами с наибольшим количеством записей в списке. В то время как Китай застопорился на уровне 173 систем, Соединенные Штаты упали со 150 систем до 126. Тем не менее, эти две страны составляют почти две трети суперкомпьютеров в TOP500.

Несмотря на то, что произошли некоторые изменения с точки зрения системных соединений, те же тенденции, что и в предыдущем списке, продолжают сохраняться. Ethernet по-прежнему выигрывал с 226 машинами, но это меньше, чем 240 машин в последнем списке. На долю Infiniband в текущем списке приходится 196 компаний, тогда как ранее их было 180. Omnipath остался неизменным с 40 машинами в списке, в то время как пользовательские межсоединения сократились с 34 соединений в последнем списке до 32 соединений в текущем. Как и в последнем списке, было только 6 систем с проприетарными сетями.

Результаты GREEN500

Системой, претендующей на первое место в рейтинге GREEN500, является Frontier Test & Development System (TDS) в ORNL в США. С общим количеством ядер 120 832 и контрольным показателем HPL 19,2 PFlop/s машина Frontier TDS представляет собой всего лишь одну стойку, идентичную реальной системе Frontier. Таким образом, вполне логично, что он превосходит Frontier с 7 733 248 ядрами и эталоном HPL со скоростью 1,102 экзафлоп/с. Тем не менее, Frontier TDS обладает впечатляющими возможностями повышения эффективности. Frontier TDS с энергоэффективностью 62,8 гигафлопс/ватт является явным лидером GREEN500.

Продолжая эту тенденцию и, возможно, даже переопределяя ее, оригинальная система Frontier в ORNL в США. Эта машина заняла первое место в списке TOP500 и смогла занять второе место в GREEN500. Эта система способна выдавать колоссальные 1,102 эксафлопс/с в тесте HPL, сохраняя при этом свою энергоэффективность на уровне 55,23 гигафлопс/ватт. Тот факт, что эта машина смогла сохранить конкурентоспособность на GREEN500, став первой эксафлопсной системой, показывает, что энергоэффективность становится главным приоритетом для высокопроизводительных вычислений.

Третье место заняла система LUMI, что является большим достижением для новичка. Несмотря на то, что это самая большая система в Европе, LUMI имеет впечатляющий рейтинг энергоэффективности 51,63 гигафлопс/ватт.

На самом деле, LUMI является частью более широкой тенденции в области высокопроизводительных вычислений, доказывающей, что не нужно жертвовать мощностью во имя эффективности. Четвертое место заняла Adastra, система HPE Cray EX на выставке GENCI-CINES, которая заняла 10-е место в рейтинге TOP500. Он также является вторым по скорости в Европе и имеет рейтинг эффективности 50,03 гигафлопс/ватт.

Победитель прошлогоднего конкурса GREEN500 опустился на 5-е место, поскольку система MN-3 от Preferred Networks в Японии получила рейтинг энергоэффективности 40,90 гигафлопс/ватт. Это улучшение по сравнению с предыдущей оценкой системы в 39,38 гигафлопс/ватт.

Результаты HPCG

В список TOP500 включены результаты теста High-Performance Conjugate Gradient (HPCG), который представляет собой альтернативный показатель для оценки производительности суперкомпьютера и призван дополнить измерение HPL.
На данный момент у нас нет данных HPCG по Frontier. Таким образом, Fugaku здесь является победителем с 16,0 HPCG-петафлопс. И снова Summit сохранил за собой 2-е место с 2,93 HPCG-петафлопс, а LUMI занял 3-е место у Sierra с 1,94 HPCG-петафлопс.

Результаты HPL- AI

Тест HPL-AI призван подчеркнуть конвергенцию рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта (ИИ), основанных на машинном и глубоком обучении, путем решения системы линейных уравнений с использованием новых алгоритмов смешанной точности, использующих современное оборудование.

Система Frontier продемонстрировала тест HPL-AI, равный 6,86 экзафлопс, что более чем в три раза превышает предыдущий результат победителя Fugaku, составлявший около 2 экзафлопс. Фугаку какое-то время был действующим чемпионом, но, похоже, Frontier пришел, чтобы встряхнуть конкурентов.

Система Chervonenkis - YANDEX Y 4 N - GA 1- TY 25- ZB 0, AMD EPYC 7702 64 C 2 GHz , NVIDIA A 100 80 GB , Infiniband , YANDEX , NVIDIA ; Yandex , Russia заняла 22 место

Текущий список top500

Публикации по теме
	Высокопроизводительные вычисления (HPC), параллельные файловые системы, HPC-СХД

	Новости HPE