News

Публикации
	2023 г. – новый этап практического применения CXL, статья
	VMware сдвигает акцент в проекте Capitola на CXL, статья
	Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
	OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
	Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
	UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
	Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
	GigaIO: CDI_решение на базе AMD для высшего образования, статья
	Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
	От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
	EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
	LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
	End-to-end 64G FC NAFA, статья
	Computational Storage, статья
	Технология KIOXIA Software-Enabled Flash™, статья
	Pavilion: 200 млн IOPS на стойку, статья
	CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
	Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
	Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
	SmartNIC – новый уровень инфраструктурной обработки, статья
	Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
	Compute, Memory и Storage, статья
	Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
	Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
	Intel® Agilex™ FPGA, статья
	Weka для AI-трансформации, статья
	Cloudera Data Platform – “лучшее из двух миров”, статья
	Fujitsu ETERNUS DSP - разработано для будущего, статья
	Технологии охлаждения для следующего поколения HPC-решений, статья
	Что такое современный HBA?, статья
	Fugaku– самый быстрый суперкомпьютер в мире, статья
	НРС – эпоха революционных изменений, статья
	Новое поколение СХД Fujitsu ETERNUS, статья
	Зональное хранение данных, статья
	За пределами суперкомпьютеров, статья
	Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
	Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
	DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
	IPsec в пост-квантовую эру, статья
	LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья

Обзоры
	Все обзоры в Storage News

Тематические публикации
	Flash-память
	Облачные вычисления/сервисы
	Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
	Современные СХД
	Информационная безопасность (ИБ), борьба с мошенничеством
	Рынки

Суперкомпьютерные центры по всему миру выводят вычисления на новый уровень с помощью DPU NVIDIA BlueField в сетях NVIDIA Quantum InfiniBand

30, май 2022 —

https://blogs.nvidia.com/blog/2022/05/30/bluefield-dpus-hpc-isc2022/

В Европе и США HPC -разработчики ускоряют суперкомпьютеры мощью ядер и ускорителей Arm внутри DPU NVIDIA BlueField-2 .

В Лос-Аламосской национальной лаборатории (LANL, Los Alamos National Laboratory ) эта работа является частью масштабного многолетнего сотрудничества с NVIDIA, целью которого является 30-кратное ускорение в вычислительных мультифизических приложениях.

Исследователи LANL прогнозируют значительный прирост производительности при использовании блоков обработки данных (DPU), работающих в сетях NVIDIA Quantum InfiniBand . Они станут пионерами в области вычислительного хранилища, сопоставления шаблонов и многого другого, используя BlueField и его программную среду NVIDIA DOCA .

Открытый API для DPU

Усилия также помогут в дальнейшем определить OpenSNAPI , интерфейс приложений, который каждый может использовать для использования DPU. Это проект Unified Communication Framework, консорциума, обеспечивающего гетерогенные вычисления для приложений HPC, в состав которого входят Arm, IBM, NVIDIA, национальные лаборатории и университеты США.

LANL уже чувствует мощь сетевых вычислений ( in-network computing ) благодаря созданной ею системе хранения на базе DPU.

Ускоренная коробка флэш-памяти (ABoF, Accelerated Box of Flash ) сочетает в себе твердотельное хранилище с ускорителями DPU и InfiniBand для ускорения критически важных для производительности частей файловой системы Linux. Она работает до 30 раз быстрее, чем аналогичные системы хранения, и должна стать ключевым компонентом инфраструктуры LANL.

ABoF поддерживает вычисления рядом с хранилищем, чтобы свести к минимуму перемещение данных и повысить эффективность конвейеров моделирования и анализа данных, сказал исследователь в недавнем блоге LANL .

Техас для облачных супервычислений

Техасский передовой вычислительный центр (TACC, Texas Advanced Computing Center ) является последним, внедрившим BlueField-2 в серверах Dell PowerEdge. Он будет использовать DPU в сети InfiniBand, чтобы превратить свою систему Lonestar6 в платформу разработки для облачных супервычислений.

Lonestar6 TACC обслуживает широкий круг разработчиков высокопроизводительных вычислений в Техасском университете A&M, Техасском техническом университете и Университете Северного Техаса, а также в ряде исследовательских центров и преподавателей.

MPI ускоряется

В 1200 милях к северо-востоку исследователи из Университета штата Огайо показали, как DPU могут ускорить работу одной из самых популярных моделей программирования высокопроизводительных вычислений на 26%.

Разгрузив критически важные части интерфейса передачи сообщений (MPI, message passing interface ), они ускорили P3DFFT, библиотеку, используемую во многих крупномасштабных симуляциях высокопроизводительных вычислений.

«DPU похожи на помощников, которые выполняют работу занятых руководителей, и они станут массовыми, потому что могут ускорить выполнение всех рабочих нагрузок», — сказал Дхабалесвар К. (ДК) Панда ( Dhabaleswar K. Panda ), профессор компьютерных наук и инженерии в штате Огайо, возглавлявший DPU. работать, используя программное обеспечение с открытым исходным кодом MVAPICH его команды .

DPU в центрах высокопроизводительных вычислений и в облаках

Двузначные числа прироста являются огромными для суперкомпьютеров, выполняющих моделирование высокопроизводительных вычислений, таких как открытие лекарств или проектирование самолетов. И облачные сервисы могут использовать эти преимущества для повышения производительности своих клиентов, сказал Панда, который получил запросы от нескольких центров высокопроизводительных вычислений на свой код.

Сети Quantum InfiniBand с такими функциями, как NVIDIA SHARP , помогают ему работать.

«Другие говорят о сетевых вычислениях, но сегодня InfiniBand поддерживает их, — сказал он.

Универсистет в Дареме выполняет балансировку нагрузки

Несколько исследовательских групп в Европе ускоряют рабочие нагрузки MPI и других высокопроизводительных вычислений с помощью DPU BlueField.

Например, Даремский университет ( Durham University ) на севере Англии разрабатывает программное обеспечение для балансировки нагрузки заданий MPI с использованием DPU BlueField в кластере Dell PowerEdge из 16 узлов. По словам главного исследователя проекта Тобиаса Вайнцирля, его работа проложит путь к более эффективной обработке лучших алгоритмов для высокопроизводительных вычислений по всему миру.

DPU в Кембридже

Исследователи из Кембриджа, Лондона и Мюнхена также используют DPU.

Со своей стороны, Университетский колледж Лондона изучает, как планировать задачи для хост-системы на DPU BlueField-2. Это возможность, которую можно использовать, например, для перемещения данных между хост-процессорами, чтобы они были там, когда они в них нуждаются.

DPU BlueField внутри серверов Dell PowerEdge в Cambridge Service for Data Driven Discovery разгружают политики безопасности, структуры хранения и другие задачи с центральных процессоров, максимально повышая производительность системы.

Тем временем исследователи из группы компьютерной архитектуры и параллельных систем Мюнхенского технического университета ищут способы разгрузить задачи MPI и операционной системы с помощью DPU в рамках проекта EuroHPC.

Вернувшись в США, исследователи из Технологического института Джорджии сотрудничают с Национальными лабораториями Сандия, чтобы ускорить работу в области молекулярной динамики с использованием DPU BlueField-2. Документ, описывающий их работу, показывает, что алгоритмы могут быть ускорены до 20 процентов без потери точности моделирования.

Расширяющаяся сеть

Ранее в этом месяце исследователи из Японии объявили о создании системы, использующей новейшие графические процессоры NVIDIA H100 с тензорными ядрами и использующей нашу самую быструю и интеллектуальную сеть — платформу NVIDIA Quantum-2 InfiniBand.

NEC построит суперкомпьютер на базе H100 производительностью около 6 PFLOPS для Центра вычислительных наук Университета Цукуба ( Center for Computational Sciences at the University of Tsukuba ). Исследователи будут использовать его для климатологии, астрофизики, больших данных, искусственного интеллекта и многого другого.

Публикации по теме
	Высокопроизводительные вычисления (HPC), параллельные файловые системы, HPC-СХД

	Новости NVIDIA