Публикации
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Excelero NVEdge для HA IoT-эры, статья
HPE: легкий путь в IIoT, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
Дезагрегированные компонуемые среды для высокопроизводительных задач, статья
HPE Primera: интеллектуальная СХД HPE 3PAR, статья
HPE Elastic Platform for Big Data and Analytics, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
FusionStorage 8.X: облачное хранилище для ЦОД нового поколения, статья
Микросхемы ускорения вычислений нейросетей, статья
Persistent Memory: новый уровень хранения данных, статья
Как строить озера данных? , статья
End-to-end NVMe AFA-массивы Huawei, статья
SweRV Core – первое RISC-V процессорное ядро Western Digital, статья
Преимущества использования SCM-кэша в составе внешних СХД HPE, статья
Технологии кэширования данных современных СХД, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
AMD представляет самый быстрый в мире ускоритель HPC для научных исследований (1)

16, ноябрь 2020  — 

Ускорители AMD Instinct ™ MI100 революционизируют высокопроизводительные вычисления (HPC) и искусственный интеллект благодаря лучшей в отрасли вычислительной производительности.

Первый ускоритель графического процессора с новой архитектурой AMD CDNA, созданный для эры экзадач

AMD  (NASDAQ: AMD) объявила о выпуске нового ускорителя AMD Instinct ™ MI100 - самого быстрого в мире графического процессора HPC и первого серверного графического процессора x86, преодолевшего барьер производительности в 10 терафлопс (FP64).  (1)  Поддерживаемый новыми платформами ускоренных вычислений от Dell, GIGABYTE, HPE и Supermicro, MI100 в сочетании с процессорами AMD EPYC ™ и открытой программной платформой ROCm ™ 4.0 разработан, чтобы продвигать новые открытия, опережающие эру экзадач.

Графический процессор AMD Instinct MI100, созданный на основе новой архитектуры AMD CDNA, обеспечивает новый класс ускоренных систем для высокопроизводительных вычислений и искусственного интеллекта в сочетании с процессорами AMD EPYC 2-  го  поколения. MI100 обеспечивает пиковую производительность FP64 до 11,5 терафлопс для высокопроизводительных вычислений и до 46,1 терафлопс матрицы FP32 для рабочих нагрузок ИИ и машинного обучения  (2)  . Благодаря новой технологии AMD Matrix Core MI100 также обеспечивает почти 7-кратное увеличение теоретической пиковой производительности FP16 с плавающей запятой для рабочих нагрузок обучения ИИ по сравнению с ускорителями AMD предыдущего поколения.  (3)

«Сегодня AMD делает важный шаг вперед на пути к эксафлопсным вычислениям, представляя AMD Instinct MI100 - самый быстрый в мире графический процессор для высокопроизводительных вычислений», - сказал Брэд Маккреди, корпоративный вице-президент AMD по графическим процессам и ускоренной обработке данных для центров обработки данных. «Наш новейший ускоритель в сочетании с открытой программной платформой AMD ROCm, ориентированный непосредственно на рабочие нагрузки, которые имеют значение в научных вычислениях, призван предоставить ученым и исследователям превосходную основу для их работы в области высокопроизводительных вычислений».

Открытая программная платформа для эры Exascale

Программное обеспечение для разработчиков AMD ROCm обеспечивает основу для экзадачных вычислений. Как набор инструментов с открытым исходным кодом, состоящий из компиляторов, программных API и библиотек, ROCm используется разработчиками программного обеспечения exascale для создания высокопроизводительных приложений. ROCm 4.0 оптимизирован для обеспечения масштабной производительности систем на базе MI100. ROCm 4.0 обновил компилятор, сделав его открытым и унифицированным для поддержки OpenMP® 5.0 и HIP. Фреймворки PyTorch и Tensorflow, оптимизированные с помощью ROCm 4.0, теперь могут достичь более высокой производительности с помощью MI100  7,8  . ROCm 4.0 - это новейшее предложение для разработчиков приложений HPC, ML и AI, которое позволяет им создавать производительное портативное программное обеспечение.

«Мы получили ранний доступ к ускорителю MI100, и предварительные результаты очень обнадеживают. Как правило, мы наблюдаем значительное повышение производительности, в 2-3 раза по сравнению с другими графическими процессорами », - сказал Бронсон Мессер, научный директор Oak Ridge Leadership Computing Facility. «Также важно понимать, какое влияние программное обеспечение оказывает на производительность. Тот факт, что открытая программная платформа ROCm и инструмент для разработки HIP являются открытым исходным кодом и работают на различных платформах, это то, чем мы были почти одержимы с тех пор, как представили самую первую гибридную систему CPU / GPU ».

Ключевые возможности и особенности ускорителя AMD Instinct MI100 включают:

•  Абсолютно  новая архитектура AMD CDNA - архитектура  AMD CDNA, разработанная для работы с графическими процессорами AMD в эпоху экзадачности и являющаяся сердцем ускорителя MI100, обеспечивает исключительную производительность и энергоэффективность.

•  Лучшая производительность FP64 и FP32 для рабочих нагрузок HPC  - обеспечивает лучшую в отрасли пиковую производительность FP64 11,5 TFLOPS и пиковую производительность FP32 23,1 TFLOPS, что позволяет ученым и исследователям по всему миру ускорить открытия в таких отраслях, как биологические науки, энергетика, финансы, академические науки, правительство, оборону и Больше.  (1)

•  Совершенно новая технология Matrix Core для высокопроизводительных вычислений и искусственного интеллекта  - повышенная производительность для полного спектра матричных операций с одинарной и смешанной точностью, таких как FP32, FP16, bFloat16, Int8 и Int4, разработанная для повышения конвергенции высокопроизводительных вычислений и искусственного интеллекта.

•  Технология AMD Infinity Fabric ™ 2-  го  поколения -  Instinct MI100 обеспечивает примерно в 2 раза большую пиковую пропускную способность однорангового (P2P) ввода-вывода по сравнению с PCIe® 4.0 с совокупной пропускной способностью до 340 ГБ / с на карту с тремя AMD Infinity Fabric ™ Ссылки.  4   На сервере графические процессоры MI100 могут быть сконфигурированы до двух полностью подключенных ульев с четырьмя графическими процессорами, каждый из которых обеспечивает до 552 ГБ / с пропускной способности ввода-вывода P2P для быстрого обмена данными.  (4)  

•  Сверхбыстрая память HBM2  -  включает  32 ГБ памяти HBM2 с высокой пропускной способностью с тактовой частотой 1,2 ГГц и обеспечивает сверхвысокую пропускную способность памяти 1,23 ТБ / с для поддержки больших наборов данных и устранения узких мест при перемещении данных в память и из памяти .  (5)

•  Поддержка новейшего отраслевого стандарта PCIe® Gen 4.0  - разработан с поддержкой новейшей технологии PCIe Gen 4.0, обеспечивающей пиковую теоретическую пропускную способность для передачи данных от ЦП к ГП до 64 ГБ / с.  (6)

Доступные серверные решения

Ускорители AMD Instinct MI100 ожидаются к концу года в системах от основных OEM и ODM-партнеров на корпоративных рынках, включая:

Dell

«Серверы Dell EMC PowerEdge будут поддерживать новый AMD Instinct MI100, который позволит быстрее анализировать данные. Это поможет нашим клиентам быстро достичь более надежных и эффективных результатов в области высокопроизводительных вычислений и искусственного интеллекта », - сказал Рави Пендеканти, старший вице-президент подразделения PowerEdge Servers, Dell Technologies. «AMD была ценным партнером в нашей поддержке продвижения инноваций в центрах обработки данных. Высокопроизводительные возможности ускорителей AMD Instinct естественным образом подходят для нашего портфеля серверов PowerEdge для искусственного интеллекта и высокопроизводительных вычислений».

GIGABYTE

«Мы рады снова работать с AMD в качестве стратегического партнера, предлагающего клиентам серверное оборудование для высокопроизводительных вычислений», - сказал Алан Чен, помощник вице-президента NCBU, GIGABYTE. «Ускорители AMD Instinct MI100 представляют собой новый уровень высокопроизводительных вычислений в центре обработки данных, обеспечивая более широкие возможности подключения и пропускную способность данных для исследований в области энергетики, молекулярной динамики и обучения глубокому обучению. Являясь новым ускорителем в портфеле GIGABYTE, наши заказчики могут рассчитывать на повышение производительности при выполнении ряда научных и промышленных рабочих нагрузок высокопроизводительных вычислений ».

Hewlett Packard Enterprise (HPE)

«Заказчики используют системы HPE Apollo для обеспечения специальных возможностей и производительности для решения ряда сложных рабочих нагрузок с большим объемом данных, связанных с высокопроизводительными вычислениями (HPC), глубоким обучением и аналитикой», - сказал Билл Маннел, вице-президент и генеральный менеджер HPC. в HPE. «С введением новой системы HPE Apollo 6500 Gen10 Plus мы продолжаем расширять наш портфель для повышения производительности рабочих нагрузок за счет поддержки нового ускорителя AMD Instinct MI100, который обеспечивает более широкие возможности подключения и обработки данных, наряду с процессором AMD EPYC ™ 2-  го  поколения. . Мы с нетерпением ждем продолжения сотрудничества с AMD, чтобы расширить наши предложения за счет новейших процессоров и ускорителей ».

Supermicro

«Мы рады, что AMD оказывает большое влияние на высокопроизводительные вычисления с помощью ускорителей AMD Instinct MI100 GPU», - сказал Вик Маляла, старший вице-президент по разработке полевых приложений и развитию бизнеса Supermicro. «Комбинация вычислительной мощности, полученной с новой архитектурой CDNA, наряду с высокой памятью и одноранговой пропускной способностью графического процессора, которую обеспечивает MI100, наши клиенты получат доступ к отличным решениям, которые будут соответствовать их требованиям к ускоренным вычислениям и критически важным корпоративным рабочим нагрузкам. . AMD Instinct MI100 станет отличным дополнением для наших серверов с несколькими графическими процессорами и нашего обширного портфеля высокопроизводительных систем и решений для построения серверных блоков ».

Технические характеристики MI100

Вычислительные единицы

Потоковые процессоры

FP64 TFLOPS (пик)

FP32 TFLOPS (пик)

Матрица FP32 TFLOPS
( пиковая )

Матрица FP16 / FP16
TFLOPS
(пиковая)

INT4 | INT8 TOPS
(пик)

bFloat 16 терафлопс
(пик)

Память HBM2
ECC

Пропускная способность памяти

120

7680

До 11,5

До 23,1

До 46,1

До 184,6

До 184,6

До 92,3 терафлопс

32 ГБ

До 1,23 ТБ / с

Вспомогательные ресурсы

•  Узнайте больше об  ускорителях AMD Instinct ™

•  Узнать больше о  решениях AMD HPC

•  Центр решений AMD HPC

•  Узнать больше о  AMD CDNA

•  Узнайте больше о  процессоре AMD EPYC ™ 2-  го  поколения

•  Станьте поклонником AMD на  Facebook

•  Следуйте за AMD в  Twitter

О AMD

Более 50 лет AMD внедряет инновации в области высокопроизводительных вычислений, графики и технологий визуализации - строительных блоков для игр, иммерсивных платформ и центров обработки данных. Сотни миллионов потребителей, ведущих предприятий из списка Fortune 500 и передовые научно-исследовательские центры по всему миру ежедневно полагаются на технологии AMD, чтобы улучшить свой образ жизни, работы и развлечений. Сотрудники AMD по всему миру сосредоточены на создании отличных продуктов, которые раздвигают границы возможного. Для получения дополнительной информации о том, как AMD реализует возможности сегодня и вдохновляет завтра, посетите  веб-сайт  AMD (NASDAQ: AMD)  ,   блог  ,   страницы Facebook   и  Twitter   .

ПРЕДУПРЕЖДЕНИЕ

Этот пресс-релиз содержит прогнозные заявления, касающиеся Advanced Micro Devices, Inc. (AMD), такие как характеристики, функциональность, производительность, доступность, время и ожидаемые преимущества продуктов AMD, включая ускоритель AMD Instinct ™ MI100, которые сделаны в соответствии с Положения Safe Harbor Закона о реформе судебных разбирательств по частным ценным бумагам 1995 года. Прогнозные заявления обычно обозначаются такими словами, как «будет», «может», «ожидает», «считает», «планирует», «намеревается», «планирует» и другие термины с аналогичным значением. Инвесторы предупреждаются, что прогнозные заявления в этом пресс-релизе основаны на текущих убеждениях, предположениях и ожиданиях. говорить только на дату этого пресс-релиза и включать риски и неопределенности, которые могут привести к тому, что фактические результаты будут существенно отличаться от текущих ожиданий. Такие заявления подвержены определенным известным и неизвестным рискам и неопределенностям, многие из которых трудно предсказать и, как правило, находятся вне контроля AMD, что может привести к тому, что фактические результаты и другие будущие события будут существенно отличаться от тех, которые выражены, подразумеваются или прогнозируются, прогнозная информация и заявления. Существенные факторы, которые могут привести к тому, что фактические результаты будут существенно отличаться от текущих ожиданий, включают, помимо прочего, следующее: доминирование корпорации Intel на рынке микропроцессоров и ее агрессивные методы ведения бизнеса; способность сторонних производителей производить AMD » s продукцию своевременно в достаточном количестве и с использованием конкурентоспособных технологий; ожидаемые объемы производства продукции AMD; наличие основного оборудования, материалов или производственных процессов; Способность AMD своевременно представлять продукты с функциями и уровнями производительности, которые приносят пользу ее клиентам; глобальная экономическая неопределенность; потеря значительного клиента; Способность AMD получать доход от полу-кастомных продуктов SoC; влияние пандемии COVID-19 на бизнес, финансовое состояние и результаты деятельности AMD; политические, правовые, экономические риски и стихийные бедствия; влияние действий правительства и нормативных актов, таких как правила экспортного управления, тарифы и меры защиты торговли; влияние приобретений, совместных предприятий и / или инвестиций на AMD » бизнес, в том числе объявленное приобретение Xilinx и неспособность интегрировать приобретенный бизнес; Способность AMD завершить слияние Xilinx; влияние объявления о слиянии Xilinx на бизнес AMD; потенциальные уязвимости безопасности; потенциальные сбои в работе ИТ, потеря данных, утечки данных и кибератаки; неопределенности, связанные с заказом и доставкой продукции AMD; квартальные и сезонные модели продаж; ограничения, налагаемые соглашениями, регулирующими выпуск нот AMD и возобновляемую кредитную линию; конкурентные рынки, на которых продается продукция AMD; рыночная конъюнктура отраслей, в которых продается продукция AMD; Зависимость AMD от интеллектуальной собственности третьих сторон при разработке и своевременном выпуске новых продуктов; Зависимость AMD от сторонних компаний при разработке дизайна, производство и поставка материнских плат, программного обеспечения и других компонентов компьютерной платформы; Зависимость AMD от поддержки корпорации Microsoft и других поставщиков программного обеспечения при проектировании и разработке программного обеспечения для работы с продуктами AMD; Зависимость AMD от сторонних дистрибьюторов и партнеров по надстройке плат; потенциальный эффект разводнения в случае конвертации конвертируемых старших облигаций с процентной ставкой 2,125% со сроком погашения в 2026 году; будущее обесценение деловой репутации и приобретения лицензий на технологии; Способность AMD привлекать и удерживать квалифицированный персонал; Способность AMD генерировать достаточный доход и операционный денежный поток или получать внешнее финансирование для исследований и разработок или других стратегических инвестиций; Задолженность AMD; Способность AMD генерировать достаточно денежных средств для обслуживания своих долговых обязательств или удовлетворения требований к оборотному капиталу; AMD ' s возможность выкупа непогашенной задолженности в случае смены контроля; цикличность полупроводниковой промышленности; влияние модификации или прерывания внутренних бизнес-процессов и информационных систем AMD; совместимость продуктов AMD с некоторым или со всем стандартным программным и аппаратным обеспечением; расходы, связанные с бракованной продукцией; эффективность цепочки поставок AMD; Способность AMD полагаться на сторонние логистические функции в цепочке поставок; Волатильность курса акций AMD; политические условия во всем мире; неблагоприятные колебания обменного курса валют; Способность AMD эффективно контролировать продажи своей продукции на сером рынке; Способность AMD надлежащим образом защитить свои технологии или другую интеллектуальную собственность; текущие и будущие претензии и судебные разбирательства; потенциальные налоговые обязательства; а также влияние законов об окружающей среде, положений, касающихся конфликтных полезных ископаемых, и других законов или постановлений. Инвесторам настоятельно рекомендуется подробно изучить риски и неопределенности в документации AMD по ценным бумагам и биржам, включая, помимо прочего, квартальный отчет AMD по форме 10-Q за квартал, закончившийся 26 сентября 2020 года.

 

© 2020 Advanced Micro Devices, Inc. Все права защищены . AMD, логотип AMD Arrow, EPYC, AMD Instinct, Infinity Fabric, ROCm и их комбинации являются товарными знаками Advanced Micro Devices, Inc. Название OpenMP и логотипы OpenMP являются зарегистрированными товарными знаками Совета по обзору архитектуры OpenMP. PCIe является зарегистрированным товарным знаком PCI-SIG Corporation. Python является товарным знаком Python Software Foundation. PyTorch является товарным знаком или зарегистрированным товарным знаком PyTorch. TensorFlow, логотип TensorFlow и любые связанные знаки являются товарными знаками Google Inc. Другие названия продуктов, используемые в этой публикации, используются только в целях идентификации и могут быть товарными знаками соответствующих компаний.

(1)  Расчеты, проведенные AMD Performance Labs по состоянию на 18 сентября 2020 года для ускорителя AMD Instinct ™ MI100 (32 ГБ HBM2 PCIe®) при пиковой частоте двигателя 1502 МГц, дали пиковое значение двойной точности 11,54 терафлопс с двойной точностью (FP64), пиковое значение матрицы одинарной точности 46,1 терафлопс. (FP32), пиковая одинарная точность 23,1 терафлопс (FP32), пиковая пиковая половинная точность 184,6 терафлопс (FP16), пиковая теоретическая производительность с плавающей запятой. Опубликованные результаты на графическом ускорителе NVidia Ampere A100 (40 ГБ) показали пиковую производительность двойной точности 9,7 терафлопс (FP64). Пиковая производительность одинарной точности 19,5 терафлопс (FP32), пиковая производительность половинной точности 78 терафлопс (FP16), производительность с плавающей запятой. Производители серверов могут варьировать предложения по конфигурации, что дает разные результаты. MI100-03

(2)  Расчеты, выполненные AMD Performance Labs по состоянию на 3 сентября 2020 года на ускорителе AMD Instinct ™ MI100 (32 ГБ HBM2 PCIe®) при пиковой частоте ядра 1502 МГц, дали пиковую теоретическую производительность одинарной точности (матрица FP32) с плавающей запятой в 46,1 терафлопс. Опубликованные результаты ускорителя графического процессора Nvidia Ampere A100 (40 ГБ) - пиковая производительность с плавающей запятой одинарной точности (FP32) 19,5 терафлопс. Результаты Nvidia можно найти по адресу: https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper.pdf. Производители серверов могут варьировать предложения по конфигурации, что дает разные результаты. MI100-01

(3)  Расчеты, выполненные лабораторией AMD Performance Labs по состоянию на 18 сентября 2020 года для ускорителя AMD Instinct ™ MI100 при пиковых тактовых частотах двигателя с ускорением 1502 МГц, дали пиковое теоретическое значение половинной точности 184,57 терафлопс в секунду (FP16) и пиковое значение пикового значения одинарной точности 46,14 терафлопс в секунду (матрица FP32) с плавающей точкой. балльная производительность. Результаты, рассчитанные для графического процессора Radeon Instinct ™ MI50 при пиковой частоте ядра 1725 МГц, показали пиковую теоретическую производительность половинной точности 26,5 терафлопс (FP16) и пиковую теоретическую производительность одинарной точности с плавающей запятой 13,25 терафлопс (матрица FP32). Производители серверов могут варьировать предложения по конфигурации, что дает разные результаты. MI100-04

(4)  Расчеты по состоянию на 18 сентября 2020 г. AMD Instinct ™ MI100 построен на ускорителях технологии AMD CDNA, поддерживающих PCIe® Gen4, обеспечивая пиковую теоретическую пропускную способность при передаче данных от ЦП к ГП до 64 ГБ / с на карту. Ускорители AMD Instinct ™ MI100 включают три канала Infinity Fabric ™, обеспечивающие пиковую теоретическую пропускную способность графического процессора до 276 ГБ / с или пропускную способность одноранговой сети (P2P) на карту графического процессора. В сочетании с поддержкой PCIe Gen4 обеспечивает совокупную пиковую пропускную способность ввода-вывода графической карты до 340 ГБ / с. У MI100 есть три канала: 92 ГБ / с * 3 канала на GPU = 276 ГБ / с. Четыре улья GPU обеспечивают пиковую теоретическую производительность P2P до 552 ГБ / с. Два улья с 4 графическими процессорами в сервере обеспечивают общую теоретическую пиковую производительность прямой P2P до 1,1 ТБ / с на каждый сервер. Технология связи AMD Infinity Fabric не включена: Четыре улья GPU обеспечивают пиковую теоретическую производительность P2P до 256 ГБ / с с PCIe® 4.0. Производители серверов могут варьировать предложения по конфигурации, что дает разные результаты. MI100-07

(5)  Расчеты AMD Performance Labs по состоянию на 5 октября 2020 года для ускорителя AMD Instinct ™ MI100, разработанного с использованием техпроцесса AMD CDNA 7 нм FinFET при пиковой частоте памяти 1200 МГц, дали пиковую теоретическую пропускную способность памяти 1,2288 терафлопс. Результаты, рассчитанные для графического процессора Radeon Instinct ™ MI50, разработанного с использованием 7-нм техпроцесса FinFET «Vega» с пиковыми частотами памяти 1000 МГц, дали пиковую теоретическую пропускную способность памяти 1,024 терафлопс. CDNA-04

(6)  Работает с материнскими платами, совместимыми с PCIe® Gen 4.0 и Gen 3.0. Производительность может отличаться от материнской платы к материнской плате. Обратитесь к поставщику системы или материнской платы для получения информации о характеристиках и функциях отдельных продуктов.

(7)  Тестирование проведено лабораториями AMD по состоянию на 30 октября 2020 года на трех платформах и версиях программного обеспечения, типичных для дат выпуска Radeon Instinct MI25 (2018), MI50 (2019) и AMD Instinct MI100 GPU (2020), на которых запущено тестовое приложение Quicksilver . Платформа MI100 (2020 г.): система GIGABYTE G482-Z51-00, состоящая из двухсокетного 64-ядерного процессора AMD EPYC ™ 7702, графического процессора AMD Instinct ™ MI100, драйвера ROCm ™ 3.10, 512 ГБ DDR4, RHEL 8.2. Платформа MI50 (2019 г.): система Supermicro® SYS-4029GP-TRT2, состоящая из Dual Socket Intel Xeon® Gold® 6132, графического процессора Radeon Instinct ™ MI50, драйвера ROCm 2.10, 256 ГБ DDR4, SLES15SP1. Платформа MI25 (2018 г.): система Supermicro SYS-4028GR-TR2, состоящая из двухъядерного процессора Intel Xeon E5-2690, графического процессора Radeon Instinct ™ MI25, драйвера ROCm 2.0.89, системной памяти DDR4 объемом 246 ГБ, Ubuntu 16.04.5 LTS. MI100-14

(8)  Тестирование проведено лабораториями AMD по состоянию на 30 октября 2020 года на трех платформах и версиях программного обеспечения, типичных для дат выпуска Radeon Instinct MI25 (2018), MI50 (2019) и AMD Instinct MI100 GPU (2020), на которых запущено тестовое приложение TensorFlow ResNet 50 FP 16, размер пакета 128. Платформа MI100 (2020): система GIGABYTE G482-Z51-00, состоящая из двухсокетного 64-ядерного процессора AMD EPYC ™ 7702, графического процессора AMD Instinct ™ MI100, драйвера ROCm ™ 3.10, DDR4 512 ГБ, RHEL 8.2 . Платформа MI50 (2019 г.): система Supermicro® SYS-4029GP-TRT2, состоящая из Dual Socket Intel Xeon® Gold® 6254, графического процессора Radeon Instinct ™ MI50, драйвера ROCm 3.0.6, 338 ГБ DDR4, Ubuntu® 16.04.6 LTS. Платформа MI25 (2018): система Supermicro SYS-4028GR-TR2, состоящая из двухпроцессорного процессора Intel Xeon E5-2690, графического процессора Radeon Instinct ™ MI25, драйвера ROCm 2.0.89, системной памяти DDR4 246 ГБ, Ubuntu 16.04.5 LTS.

Публикации по теме
Высокопроизводительные вычисления (HPC), параллельные файловые системы, HPC-СХД
 
Новости AMD

© "Storage News" journal, Russia&CIS
Редакция: 115516, Москва, а/я 88; тел./факс - (495) 233-4935;
www.storagenews.ru; info@storagenews.ru.