Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
Три университета создают прототип реконфигурируемого суперкомпьютера ACES

23, сентябрь 2021  — 

https://www.hpcwire.com/2021/09/23/three-universities-team-for-nsf-funded-aces-reconfigurable-supercomputer-prototype/

По мере замедления действия закона Мура разработчики высокопроизводительных вычислений все чаще ищут увеличения скорости в специализированном коде и специализированном оборудовании, но эта специализация, в свою очередь, может сделать тестирование и развертывание кода сложнее, чем когда-либо. Теперь исследователи из Техасского университета A&M, Университета Иллинойса в Урбана-Шампейн и Техасского университета в Остине объединились при финансовой поддержке NSF для создания прототипа суперкомпьютера (ACES) стоимостью 5 миллионов долларов с динамически конфигурируемым smorgasbord оборудованием, стремясь поддержать разработчиков, поскольку потребности в оборудовании становятся все более разнообразными.

ACES (сокращение от «Accelerating Computing for Emerging Sciences») представлен как «инновационная составная аппаратная платформа». ACES будет использовать компонуемую структуру на основе PCIe от Liqid, чтобы предложить доступ к процессорам Intel Sapphire Rapids с высокой пропускной способностью памяти и более чем 20 ускорителям: Intel FPGAs; NEC Vector Engines; NextSilicon co-processors; Graphcore IPUs (Intelligence Processing Units, блоки обработки информации) и будущие графические процессоры Intel Ponte Vecchio. Все это оборудование будет связано с памятью Intel Optane и DDN Lustre Storage и подключено к сети Mellanox NDR 400 Гбит/с.

«ACES позволит приложениям и рабочим процессам динамически интегрировать различные ускорители, память и сетевые вычислительные протоколы для сбора новых идей за счет быстрой обработки больших объемов данных», - говорится в гранте NSF , - «и предоставит исследователям уникальную платформу для производства сложные модели гибридного программирования, которые эффективно поддерживают вычисления, которые раньше были невозможны ».

«ACES делает следующий шаг по сравнению с текущими и запланированными ресурсами XSEDE, объединяя возможности компоновки, реконфигурируемое оборудование, новые ускорители, процессоры памяти с высокой пропускной способностью и сети, которые в настоящее время недоступны для исследователей», - сказал Хунгао Лю ( Honggao Liu ), исполнительный директор подразделения Texas A&M High Performance Research Computing ( HPRC) и главный исследователь проекта ACES, сообщил HPCwire . «ACES использует инновационную платформу компонуемой инфраструктуры Liqid, которая унифицирует поддержку нескольких фабрик для компонуемости через PCIe 5.0, позволяя динамически соединять более 20 различных ускорителей или твердотельных накопителей Optane с вычислительным узлом в зависимости от требований пользователя. Правильные ускорители могут использоваться в зависимости от рабочего процесса, в то время как разблокированные ресурсы могут свободно выделяться для других заданий ».

«По сути, они смогут создавать настраиваемую среду, которая им необходима для каждого задания, и не будут ограничены содержимым физического серверного узла», - добавил Тимоти Кокерилл ( Timothy Cockerill ), директор по обслуживанию пользователей Техасского центра передовых вычислений (TACC). и один из главных исследователей ACES.

Лю сказал, что команда надеется, что платформа ACES будет развернута к сентябрю 2022 года и что она будет размещена в центре обработки данных в кампусе Texas A&M.

Система ACES будет использоваться для поддержки исследователей в широком диапазоне дисциплин, при этом исследователи будут перечислять все, от информатики населения в области здравоохранения и сельскохозяйственных наук до моделирования климата и квантовой химии в возможных приложениях универсального оборудования. Лю объяснил, что ресурсы ACES будут координироваться через системы, поддерживаемые NSF.

«Таким образом, система ACES окажет неоценимую поддержку передовым проектам в широком спектре исследовательских дисциплин в стране», - сказал Лю. «ACES также будет использовать усилия HPRC по продвижению науки и расширению участия в вычислениях на уровне K-12, университетском и профессиональном уровнях, чтобы оказать трансформирующее влияние на национальном уровне, сосредоточив внимание на обучении, образовании и информационно-пропагандистской работе».

«Захватывающие достижения во многих областях науки станут возможными благодаря использованию гибридных вычислительных ресурсов и легко адаптируемой структуры, предлагаемой ACES для обеспечения все более сложных научных рабочих процессов, управляемых большими геопространственными данными и искусственным интеллектом», - добавил Шауэн Ван ( Shaowen Wang ), профессор географии и географической информации. естествознания в Университете Иллинойса в Урбане-Шампейне и соруководителя исследования ACES. (В число других главных исследователей проекта входят Лиза Перес ( Lisa Perez ) и Дхрува Чакраворти ( Dhruva Chakravorty ), оба из HPRC в Texas A&M.)

Грант был выделен для этой системы 5 млн долларов с октября 2021 года до предполагаемой даты окончания в сентябре 2026 года, плюс дополнительно 1 миллион долларов в год в течение пяти лет на эксплуатацию и поддержку системы. Грант также знаменует собой еще один успех для восходящей звезды высокопроизводительных вычислений Liqid, которая только в прошлом году одержала три победы подряд в рамках Программы модернизации высокопроизводительных вычислений (HPCMP) Министерства обороны.

«Основной принцип ACES заключается в том, что вычислительную задачу следует отнести к технологии, которая лучше всего подходит для работы с ней, что дает исследователям возможность по-настоящему использовать сильные стороны этих технологий», - сказал Лю HPCwire . «Позволяя исследователям работать на процессорах и ускорителях, наиболее подходящих для их рабочих процессов, ACES принесет пользу многим исследовательским и опытно-конструкторским проектам в научных и технических дисциплинах, позволяя извлекать новые идеи из быстрой обработки больших объемов данных».

Чтобы узнать больше о проекте ACES, посетите домашнюю страницу проекта Texas A&M здесь или прочитайте грант NSF, финансирующий проект здесь .

Публикации по теме
Высокопроизводительные вычисления (HPC), параллельные файловые системы, HPC-СХД
 
Новости Liqid

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.