Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
СОПРОЦЕССОРЫ INTEL® XEON PHI™: НОВЫЕ ГОРИЗОНТЫ ДЛЯ НАУЧНЫХ ИССЛЕДОВАНИЙ

13, ноябрь 2012  —  Для решения наиболее актуальных проблем современного общества требуются все более мощные вычислительные системы. Начиная с моделирования климата и заканчивая исследованиями в области фармации и вопросами национальной безопасности, высокопроизводительные вычисления помогают развитию фундаментальных и прикладных исследований.

Intel стимулирует развитие научных исследований и представляет сопроцессоры Intel® Xeon Phi™, которые позволят увеличить производительность систем, обрабатывающих высокопараллельные рабочие нагрузки. Созданные на базе архитектуры Intel® Many Integrated Core (Intel® MIC) , сопроцессоры Intel Xeon Phi расширяют существующие семейства процессоров Intel® Xeon® E5-2600/4600 для повышения производительности и эффективности работы приложений, которые создадут настоящий прорыв в области производства, энергетики, биологических наук и в других сферах жизни. Сопроцессоры Intel Xeon Phi также будут способствовать выходу Intel на уровень эксафлопсной производительности (тысячекратное увеличение скорости работы по сравнению с петафлопсными вычислениями) к 2018 г.

Общие модели программирования для всего кода

Архитектура Intel® поддерживается широким набором языков и моделей программирования и инструментов, которые могут использоваться как с процессорами Intel Xeon, так с сопроцессорами Intel Xeon Phi. Это может значительно снизить избыточную сложность разработки, оптимизации и поддержания программного кода. Приложения по-прежнему вынуждены использовать модели параллельного программирования для любого используемого параллельного аппаратного обеспечения, однако, применяя подход Intel, разработчики могут использовать общие модели, инструменты и принципы работы. Инвестиции, сделанные в параллельный код, позволят получить преимущества в различных вычислительных средах.

Высокая эффективность параллельной обработки

Несмотря на то, что семейство процессоров Intel Xeon E5 остается оптимальным решением для большинства современных приложений, сопроцессоры Intel Xeon Phi обеспечивают более эффективную производительность для высокопараллельных приложений. Использование большего количества ядер и поддержка большего количества вычислительных потоков позволяют добиться более высокого уровня параллелизма. Увеличенный параллелизм работы помогает компенсировать более низкую скорость работы каждого отдельного ядра для повышения обще производительности рабочих нагрузок, которые можно разделить на несколько одновременно обрабатываемых задач.

Сопроцессоры Intel Xeon Phi: ключевые характеристики

Сопроцессоры Intel Xeon Phi – это инновационные решения, которые имеют несколько функциональных возможностей, способствующих развитию высокопроизводительных вычислений.

  • Оптимальный объем памяти для высокопроизводительных систем: сопроцессоры Intel Xeon Phi поддерживают до 8 ГБайт системной памяти (7,75 ГБайт с кодом коррекции ошибок) с пиковой пропускной способностью 352 Гбит/с. Это позволят гарантировать высокую скорость сбора и анализа данных.
  • Большой объем кэш-памяти: благодаря поддержке до 30,5 МБайт кэш-памяти второго уровня, сопроцессоры Intel Xeon Phi способны предоставить нужный объем вычислительных ресурсов для надежной работы высокопараллельных рабочих нагрузок.
  • Более широкий параллелизм данных за счет использования усовершенствованного 512-разрядного блока обработки.
  • Поддержка многими разработчиками программных инструментов в рамках стандартных решений.
  • Поддержка ОС Linux: Red Hat Enterprise Linux версии 6.x и SuSE Linux версии 12 и выше.

Описание моделей сопроцессоров Intel® Xeon Phi™

Модель, №

Форм-фактор, охлаждение

Пиковая производительность двойной точности

Кол-во ядер

Тактовая частота (ГГц)

 Скорость работы модулей памяти GDDR5 (гигатрансферов/с)

Пиковая пропускная способность памяти

Объем системной памяти (ГБайт)

Объем кэш-памяти второго уровня (МБайт)

Копроцессор (плата) TDP (Вт)

Технологический процесс

SE10P (специальная версия)

PCIe, пассивное охлаждение

1073 гигафлопс

61

1,1

5,5

352

8

30,5

300

22-нм

SE10X (специальная версия)

PCIe, без охлаждения

1073 гигафлопс

61

1,1

5,5

352

8

30,5

300

5110P

PCIe, пассивное охлаждение

1011 гигафлопс

60

1,053

5

320

8

30

225

Серия 3100
PCIe, активное охлаждение
Более 1 терафлопс
Информация будет доступна при выпуске сопроцессоров серии 3100
5
240
6
Более 25
300
PCIe, пассивное охлаждение
Более 1 терафлопс
Выпуск запланирован на первую половину 2013 г.
5
240
6
Более 25
300

Производительность

Результаты оценки производительности, приведенные в этом документе, получены в результате теста, в рамках которого сравнивается производительность оптимизированных процессоров с производительностью оптимизированных сопроцессоров. Это позволяет избежать переоценки сопроцессоров. Кроме того, два процессора используются для сравнения с одним сопроцессором для того, чтобы сравнить одинаковое энергопотребление и для того, чтобы избежать переоценки сопроцессора.

Результаты синтетических тестов

Название теста

Результат

SGEMM*

До 2,9 раза более высокий результат

DGEMM*

До 2,8 раза более высокий результат

SMP Linpack*

До 2,6 раза более высокий результат

STREAM Triad*

До 2,2 раза более высокий результат

Тесты проводились с использованием одного сопроцессора Intel® Xeon Phi™ и одного двухпроцессорного сервера на базе процессора Intel® Xeon® E5-2670. Сравнивались только параллельные, потоковые и векторизированные коды. Текущая версия библиотеки программ Intel Math Kernel Library (MKL) использовалась для тестов SGEMM*, DGEMM* и SMP Linpack*.

Результаты работы приложений

Заказчик

Приложение

Увеличение производительности 1 по сравнению с процессором Xeon

Los Alamos*

Molecular Dynamics

До 2,52 раза

Acceleware*

8 th order isotropic variable velocity

До 2,05 раза

Jefferson Labs*

Lattice QCD

До 2,27 раза

Financial Services*

Black-Scholes SP

Monte Carlo SP

До 10,75 раза

До 8,92 раза

Sandia Labs*

MiniFF

(Finite Element Solver)

До 1,7 раза 3

Sinopec*

Seismic Imaging

До 2,53 раза 2

Программное обеспечение и рабочие нагрузки, использованные в тестах оценки производительности, могли быть оптимизированы для процессоров Intel. Результаты тестов оценки производительности, включая SYSmark* и MobileMark*, измерены с использованием определенных компьютерных систем, компонентов, ПО, операций и функций. Любые модификации могут привести к изменению результатов. Необходимо ознакомиться с другой информацией и результатами тестов, включая сравнение производительности этой продукции с другими предложениями.

Относительная производительность подсчитана при присвоении базового значения 1.0 результату теста. Значение реального результата теста для базовой платформы затем было разделено на значение каждого конкретного результата теста для каждой из платформ.

Тесты производительности проводились с использованием определенных компьютеров и/или компонентов и отражают приблизительную производительность продукции Intel. Изменение аппаратных или программных компонентов или конфигурации может привести к изменению реальной производительности. Покупателям необходимо обратиться к другим источникам информации для оценки производительности систем или компонентов, которые они хотят приобрести. Дополнительная информация о тестах производительности и производительности продукции Intel представлена в Intel Performance Benchmark Limitations .

Синтетические тесты

1. Процессор Intel® Xeon® E5-2670 использовался для всей матрицы SGEMM = 13824 x 13824, DGEMM 7936 x 7936, SMP Linpack 30720 x 30720

2. Сопроцессор Intel® Xeon Phi™ SE10P (с кодом коррекции ошибок) с программным стеком Gold Release Candidate, SGEMM = 15360 x 15360, DGEMM 7680 x 7680, SMP Linpack 26872 x 28672

Результаты работы приложений

Xeon = процессор Intel® Xeon®;

Xeon Phi = сопроцессор Intel® Xeon Phi™

  1. 2 процессора Xeon* против 1 процессора Xeon Phi* (предварительная версия аппаратного и программного обеспечения и приложения запускаются на 100% на сопроцессоре, если не указано другое)
  2. 2 процессора Xeon* против 2 процессоров Xeon* + 2 процессоров Xeon Phi* (без нагрузки)
  3. Кластер с 4 узлами, каждый узел с 2 процессорами Xeon* (сравнение производительности кластера с и без 1 процессора Xeon Phi* на узел) (гетеро)
  4. Измерено корпорацией Intel в октябре 2012 г.
Публикации по теме
Центры обработки данных
 
Новости INTEL

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.