Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
Вычислительные платформы следующего поколения, сертифицированные NVIDIA, для повышения производительности ИИ, видео и анализа данных

22, март 2023  — 

https://developer.nvidia.com/blog/nvidia-certified-next-generation-computing-platforms-for-ai-video-and-data-analytics-performance/

В ближайшие годы бизнес - приложения   вычислений с ускорением   на GPU значительно расширятся .   Одной из самых быстрорастущих тенденций является использование генеративного ИИ для создания человекоподобного текста и всех типов изображений .  

Взрыв интереса рынка к генеративному ИИ обусловлен такими технологиями , как   модели-трансформеры  , которые позволяют использовать ИИ в повседневных приложениях , от разговорного текста до создания белковых структур .   Визуализация и 3D- вычисления также быстро вызывают интерес , особенно в области промышленного моделирования и совместной работы . 

Графические процессоры могут стать важным фактором повышения эффективности и экономии затрат на анализ данных , бизнес - аналитику и машинное обучение , а также на ускорение основных приложений , таких как   Apache Spark  .  Наконец , развертывание логических выводов ИИ на периферии представляет собой одну из самых быстрорастущих областей для предприятий , обусловленную расширением интеллектуальных пространств и промышленной автоматизацией . 

Появляется новое поколение вычислительных технологий , предназначенных для удовлетворения этих все более сложных вычислительных потребностей .   Сюда входят новые архитектуры GPU от NVIDIA, а также новые процессоры от AMD, Intel и NVIDIA. 

Мировые производители систем создали новые системы , которые объединяют их в мощные вычислительные платформы , предназначенные для решения всего спектра рабочих нагрузок ускоренных вычислений .   Эти системы   сертифицированы NVIDIA   для обеспечения наилучшей производительности , надежности и масштабируемости для корпоративных решений и доступны для покупки уже сегодня .   Посетите   каталог квалифицированных систем  , чтобы узнать больше .   В этом посте описываются некоторые из этих новых технологий и обсуждаются наилучшие способы их использования предприятиями .

Ускорьте генеративный ИИ и большие языковые модели

Серверы NVIDIA HGX H100  , оптимизированные для обучения больших языковых моделей и логических выводов ,   работают до 4 раз быстрее при обучении ИИ и до 30 раз быстрее при выводе ИИ по сравнению с графическими   процессорами NVIDIA A100 с тензорными ядрами   предыдущего поколения .* Новейшие серверы , включающие новые поколения ЦП , обеспечивают высочайшую производительность для ИИ и   высокопроизводительных вычислений  , как подробно описано ниже .

•  4- процессорные графические процессоры H100 с 268 TFLOP FP64

•  8- процессорные графические процессоры H100 с производительностью 31 664 терафлопс FP8

•  3.6 TFLOPs FP16 с сетевыми вычислениями NVIDIA SHARP

•  NVLink четвертого поколения с в 3 раза более быстрой связью по технологии all-reduce

•  Сквозной интерфейс PCIe Gen5 для более высокой скорости передачи данных от ЦП к графическому процессору и сети

•  Пропускная способность памяти 3,35 ТБ / с на GPU

* Конфигурация : кластер HGX A100: сеть HDR IB.   Кластер HGX H100: сеть NDR IB, GPT-3 16 B 512 ( пакет 256), GPT-3 16 K ( пакет 512).   Все показатели производительности взяты из технического описания архитектуры графического процессора NVIDIA H100 .

Рисунок 1. NVIDIA HGX H100 значительно превосходит NVIDIA HGX A100 в производительности логических выводов и обучения в реальном времени в различных конфигурациях

На презентации NVIDIA GTC 2023 NVIDIA анонсировала NVIDIA H100 NVL, продукт H100 PCIe с двойным подключением для NVLink и 94 ГБ памяти HBM3. Он идеально подходит для больших языковых моделей и обеспечивает 12-кратную производительность по сравнению с NVIDIA HGX A100 для GPT-3.

Конфигурация графического процессора NVIDIA H100 PCIe включает подписку на программный пакет NVIDIA AI Enterprise для оптимизации разработки и развертывания рабочих нагрузок ИИ. Он обеспечивает все возможности графических процессоров NVIDIA H100 всего за 350 Вт расчетной тепловой мощности (TDP). В этой конфигурации можно дополнительно использовать мост NVLink для подключения до двух графических процессоров с пропускной способностью 600 ГБ/с, что почти в 5 раз больше PCIe Gen5.

Графический процессор NVIDIA H100 PCIe хорошо подходит для основных серверов с ускорением, которые размещаются в стандартных стойках с более низким энергопотреблением, и обеспечивает отличную производительность для приложений, масштабируемых от одного до четырех графических процессоров одновременно, включая приложения для вывода ИИ и высокопроизводительных вычислений.

Партнеры NVIDIA уже сегодня поставляют сертифицированные NVIDIA серверы с шиной H100 PCIe. Посетите каталог квалифицированных систем , чтобы узнать больше. Ожидается, что системы других партнеров с NVIDIA H100 PCIe и NVIDIA HGX H100 будут сертифицированы NVIDIA позже в этом году. В совокупности эти новые платформы позволяют предприятиям запускать новейшие приложения для ИИ и высокопроизводительных вычислений с еще большей производительностью и большей масштабируемостью.

Энергоэффективная производительность для ИИ-видео и логических выводов

Графический процессор NVIDIA Ada Lovelace L4 с тензорными ядрами обеспечивает универсальное ускорение и энергоэффективность для видео, ИИ, виртуальных рабочих станций и графических приложений на предприятии, в облаке и на периферии. А благодаря платформе искусственного интеллекта NVIDIA и подходу с полным стеком графический процессор L4 оптимизирован для обработки видео и логических выводов в масштабе для широкого спектра приложений искусственного интеллекта, чтобы обеспечить наилучшее персонализированное взаимодействие. Чтобы узнать больше, см. статью Повышение производительности ИИ-видео и вывода ИИ с помощью графических процессоров NVIDIA L4 .

Являясь наиболее эффективным ускорителем NVIDIA для массовых пользователей, серверы, оснащенные графическим процессором L4, обеспечивают до 120 раз более высокую производительность видео ИИ по сравнению с решениями на базе ЦП, обеспечивая при этом в 2,7 раза более высокую производительность генеративного ИИ. Они обеспечивают более чем в 4 раза большую графическую производительность по сравнению с предыдущим поколением. Графический процессор NVIDIA L4 отличается универсальным энергоэффективным низкопрофильным форм-фактором с одним слотом, что делает его идеальным для периферийных, облачных и корпоративных развертываний.

Рисунок 2. Графический процессор NVIDIA L4 повышает производительность видео и ИИ по сравнению с графическим процессором NVIDIA T4 Tensor Core.

Вариант использования графического процессора NVIDIA L4 Edge выигрывает от ускорения видео с аппаратными декодерами и кодировщиками, а также ускорения искусственного интеллекта с тензорными ядрами. Они ценны в приложениях для анализа периферийного видео для умных городов, обеспечения качества производства и розничного маркетинга в умных пространствах. Графический процессор L4 специально разработан для удовлетворения требований к ИИ в приложениях для обработки краевых датчиков HPC. Его графическая и видеопроизводительность превосходит визуализацию для научных приложений на периферийном приборе.

Графический процессор NVIDIA L4 доступен в сертифицированных NVIDIA системах от партнеров NVIDIA, включая Advantech, ASUS, Atos, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Lenovo, QCT и Supermicro, в более чем 100 уникальных моделях серверов.

ЦП следующего поколения

Достижения в технологиях ЦП дополняют новые графические процессоры NVIDIA. Новейшее поколение процессоров включает процессоры Intel Xeon Scalable 4-го поколения, также известные как Sapphire Rapids, а также процессоры AMD EPYC 4-го поколения, также известные как Genoa. Эти новейшие архитектуры обладают возможностями, которые позволяют предприятиям запускать новейшие приложения ИИ с еще большей производительностью и большим масштабом. Это включает в себя высокую скорость передачи данных по системной шине и более высокую пропускную способность данных из основной памяти.

Суперчип NVIDIA Grace Hopper , основанный на архитектуре Arm, обеспечивает превосходную производительность и энергоэффективность. Grace Hopper Superchip, созданный для гигантских ИИ и высокопроизводительных вычислений, оснащен NVLink C2C, чтобы обеспечить согласованную модель памяти ЦП и ГП для ускоренного ИИ.

Сертифицированные NVIDIA системы для ускоренных вычислений

Поскольку каждое новое поколение технологий усложняется, потребность в предварительно проверенных решениях для оптимизации сбора данных больше, чем когда-либо. Программа NVIDIA-Certified Systems была создана специально для удовлетворения этой потребности.

Сертифицированные системы NVIDIA объединяют графические процессоры NVIDIA и высокоскоростную безопасную сеть NVIDIA с системами от ведущих партнеров NVIDIA в конфигурациях, проверенных на оптимальную производительность, надежность и масштабируемость для различных рабочих нагрузок.

Тесты основаны на реальных данных и представляют новейшие приложения с ускорением на GPU, включая обучение глубокому обучению с помощью PyTorch и TensorFlow, высокопроизводительные вычисления, анализ данных с помощью Apache Spark и 3D-вычисления с NVIDIA Omniverse .

Сертификация полностью построена на наборе тестов на основе контейнеров с использованием Kubernetes для оркестровки, гарантируя, что любая сертифицированная система может быть легко интегрирована в современные облачные среды управления.

Важно понимать разницу между квалификацией и сертификацией NVIDIA. Квалифицированная система прошла температурные, механические испытания, испытания на питание и целостность сигнала, чтобы гарантировать полную функциональность конкретного графического процессора NVIDIA в этой модели сервера. Сертифицированная система прошла ряд тестов для проверки ее производительности для широкого спектра категорий рабочих нагрузок, а также для сетевых функций, безопасности и функций управления. Эти возможности становятся критически важными для любого корпоративного вычислительного решения.

Если вы хотите убедиться, что система поддерживается , а также оптимально спроектирована и настроена, выберите сертифицированную систему.

Вычислительные платформы нового поколения для предприятий

Сертифицированные NVIDIA системы от мировых производителей с графическими и центральными технологиями нового поколения доступны уже сегодня. Посетите каталог квалифицированных систем , чтобы узнать, какие модели доступны у предпочитаемого вами поставщика.

Об авторе Чару Чаубал (Charu Chaubal )

Чару Чаубал работает в области маркетинга продуктов в группе корпоративных вычислительных платформ в NVIDIA. Он имеет более чем 20-летний опыт работы в области маркетинга, обучения клиентов и предварительной продажи технологических продуктов и услуг. Чару работал в различных областях, таких как облачные вычисления, гиперконвергентная инфраструктура и ИТ-безопасность. В качестве лидера по технологическому маркетингу в VMware он помог запустить множество предложений, которые в совокупности превратились в многомиллиардные компании. Ранее он работал в Sun Microsystems, где разрабатывал программные решения для управления распределенными ресурсами и инфраструктуры высокопроизводительных вычислений. Чару имеет докторскую степень. в химическом машиностроении и является автором нескольких патентов.

Публикации по теме
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
 
Новости NVIDIA

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.