Три университета создают прототип реконфигурируемого суперкомпьютера ACES
23, сентябрь 2021 По мере замедления действия закона Мура разработчики высокопроизводительных вычислений все чаще ищут увеличения скорости в специализированном коде и специализированном оборудовании, но эта специализация, в свою очередь, может сделать тестирование и развертывание кода сложнее, чем когда-либо. Теперь исследователи из Техасского университета A&M, Университета Иллинойса в Урбана-Шампейн и Техасского университета в Остине объединились при финансовой поддержке NSF для создания прототипа суперкомпьютера (ACES) стоимостью 5 миллионов долларов с динамически конфигурируемым smorgasbord оборудованием, стремясь поддержать разработчиков, поскольку потребности в оборудовании становятся все более разнообразными. ACES (сокращение от «Accelerating Computing for Emerging Sciences») представлен как «инновационная составная аппаратная платформа». ACES будет использовать компонуемую структуру на основе PCIe от Liqid, чтобы предложить доступ к процессорам Intel Sapphire Rapids с высокой пропускной способностью памяти и более чем 20 ускорителям: Intel FPGAs; NEC Vector Engines; NextSilicon co-processors; Graphcore IPUs (Intelligence Processing Units, блоки обработки информации) и будущие графические процессоры Intel Ponte Vecchio. Все это оборудование будет связано с памятью Intel Optane и DDN Lustre Storage и подключено к сети Mellanox NDR 400 Гбит/с. «ACES позволит приложениям и рабочим процессам динамически интегрировать различные ускорители, память и сетевые вычислительные протоколы для сбора новых идей за счет быстрой обработки больших объемов данных», - говорится в гранте NSF , - «и предоставит исследователям уникальную платформу для производства сложные модели гибридного программирования, которые эффективно поддерживают вычисления, которые раньше были невозможны ». «ACES делает следующий шаг по сравнению с текущими и запланированными ресурсами XSEDE, объединяя возможности компоновки, реконфигурируемое оборудование, новые ускорители, процессоры памяти с высокой пропускной способностью и сети, которые в настоящее время недоступны для исследователей», - сказал Хунгао Лю ( Honggao Liu ), исполнительный директор подразделения Texas A&M High Performance Research Computing ( HPRC) и главный исследователь проекта ACES, сообщил HPCwire . «ACES использует инновационную платформу компонуемой инфраструктуры Liqid, которая унифицирует поддержку нескольких фабрик для компонуемости через PCIe 5.0, позволяя динамически соединять более 20 различных ускорителей или твердотельных накопителей Optane с вычислительным узлом в зависимости от требований пользователя. Правильные ускорители могут использоваться в зависимости от рабочего процесса, в то время как разблокированные ресурсы могут свободно выделяться для других заданий ». «По сути, они смогут создавать настраиваемую среду, которая им необходима для каждого задания, и не будут ограничены содержимым физического серверного узла», - добавил Тимоти Кокерилл ( Timothy Cockerill ), директор по обслуживанию пользователей Техасского центра передовых вычислений (TACC). и один из главных исследователей ACES. Лю сказал, что команда надеется, что платформа ACES будет развернута к сентябрю 2022 года и что она будет размещена в центре обработки данных в кампусе Texas A&M. Система ACES будет использоваться для поддержки исследователей в широком диапазоне дисциплин, при этом исследователи будут перечислять все, от информатики населения в области здравоохранения и сельскохозяйственных наук до моделирования климата и квантовой химии в возможных приложениях универсального оборудования. Лю объяснил, что ресурсы ACES будут координироваться через системы, поддерживаемые NSF. «Таким образом, система ACES окажет неоценимую поддержку передовым проектам в широком спектре исследовательских дисциплин в стране», - сказал Лю. «ACES также будет использовать усилия HPRC по продвижению науки и расширению участия в вычислениях на уровне K-12, университетском и профессиональном уровнях, чтобы оказать трансформирующее влияние на национальном уровне, сосредоточив внимание на обучении, образовании и информационно-пропагандистской работе». «Захватывающие достижения во многих областях науки станут возможными благодаря использованию гибридных вычислительных ресурсов и легко адаптируемой структуры, предлагаемой ACES для обеспечения все более сложных научных рабочих процессов, управляемых большими геопространственными данными и искусственным интеллектом», - добавил Шауэн Ван ( Shaowen Wang ), профессор географии и географической информации. естествознания в Университете Иллинойса в Урбане-Шампейне и соруководителя исследования ACES. (В число других главных исследователей проекта входят Лиза Перес ( Lisa Perez ) и Дхрува Чакраворти ( Dhruva Chakravorty ), оба из HPRC в Texas A&M.) Грант был выделен для этой системы 5 млн долларов с октября 2021 года до предполагаемой даты окончания в сентябре 2026 года, плюс дополнительно 1 миллион долларов в год в течение пяти лет на эксплуатацию и поддержку системы. Грант также знаменует собой еще один успех для восходящей звезды высокопроизводительных вычислений Liqid, которая только в прошлом году одержала три победы подряд в рамках Программы модернизации высокопроизводительных вычислений (HPCMP) Министерства обороны. «Основной принцип ACES заключается в том, что вычислительную задачу следует отнести к технологии, которая лучше всего подходит для работы с ней, что дает исследователям возможность по-настоящему использовать сильные стороны этих технологий», - сказал Лю HPCwire . «Позволяя исследователям работать на процессорах и ускорителях, наиболее подходящих для их рабочих процессов, ACES принесет пользу многим исследовательским и опытно-конструкторским проектам в научных и технических дисциплинах, позволяя извлекать новые идеи из быстрой обработки больших объемов данных». Чтобы узнать больше о проекте ACES, посетите домашнюю страницу проекта Texas A&M здесь или прочитайте грант NSF, финансирующий проект здесь . |
|