Вычислительные платформы следующего поколения, сертифицированные NVIDIA, для повышения производительности ИИ, видео и анализа данных
22, март 2023 В ближайшие годы бизнес - приложения вычислений с ускорением на GPU значительно расширятся . Одной из самых быстрорастущих тенденций является использование генеративного ИИ для создания человекоподобного текста и всех типов изображений . Взрыв интереса рынка к генеративному ИИ обусловлен такими технологиями , как модели-трансформеры , которые позволяют использовать ИИ в повседневных приложениях , от разговорного текста до создания белковых структур . Визуализация и 3D- вычисления также быстро вызывают интерес , особенно в области промышленного моделирования и совместной работы . Графические процессоры могут стать важным фактором повышения эффективности и экономии затрат на анализ данных , бизнес - аналитику и машинное обучение , а также на ускорение основных приложений , таких как Apache Spark . Наконец , развертывание логических выводов ИИ на периферии представляет собой одну из самых быстрорастущих областей для предприятий , обусловленную расширением интеллектуальных пространств и промышленной автоматизацией . Появляется новое поколение вычислительных технологий , предназначенных для удовлетворения этих все более сложных вычислительных потребностей . Сюда входят новые архитектуры GPU от NVIDIA, а также новые процессоры от AMD, Intel и NVIDIA. Мировые производители систем создали новые системы , которые объединяют их в мощные вычислительные платформы , предназначенные для решения всего спектра рабочих нагрузок ускоренных вычислений . Эти системы сертифицированы NVIDIA для обеспечения наилучшей производительности , надежности и масштабируемости для корпоративных решений и доступны для покупки уже сегодня . Посетите каталог квалифицированных систем , чтобы узнать больше . В этом посте описываются некоторые из этих новых технологий и обсуждаются наилучшие способы их использования предприятиями . Ускорьте генеративный ИИ и большие языковые моделиСерверы NVIDIA HGX H100 , оптимизированные для обучения больших языковых моделей и логических выводов , работают до 4 раз быстрее при обучении ИИ и до 30 раз быстрее при выводе ИИ по сравнению с графическими процессорами NVIDIA A100 с тензорными ядрами предыдущего поколения .* Новейшие серверы , включающие новые поколения ЦП , обеспечивают высочайшую производительность для ИИ и высокопроизводительных вычислений , как подробно описано ниже .
* Конфигурация : кластер HGX A100: сеть HDR IB. Кластер HGX H100: сеть NDR IB, GPT-3 16 B 512 ( пакет 256), GPT-3 16 K ( пакет 512). Все показатели производительности взяты из технического описания архитектуры графического процессора NVIDIA H100 . Рисунок 1. NVIDIA HGX H100 значительно превосходит NVIDIA HGX A100 в производительности логических выводов и обучения в реальном времени в различных конфигурациях На презентации NVIDIA GTC 2023 NVIDIA анонсировала NVIDIA H100 NVL, продукт H100 PCIe с двойным подключением для NVLink и 94 ГБ памяти HBM3. Он идеально подходит для больших языковых моделей и обеспечивает 12-кратную производительность по сравнению с NVIDIA HGX A100 для GPT-3. Конфигурация графического процессора NVIDIA H100 PCIe включает подписку на программный пакет NVIDIA AI Enterprise для оптимизации разработки и развертывания рабочих нагрузок ИИ. Он обеспечивает все возможности графических процессоров NVIDIA H100 всего за 350 Вт расчетной тепловой мощности (TDP). В этой конфигурации можно дополнительно использовать мост NVLink для подключения до двух графических процессоров с пропускной способностью 600 ГБ/с, что почти в 5 раз больше PCIe Gen5. Графический процессор NVIDIA H100 PCIe хорошо подходит для основных серверов с ускорением, которые размещаются в стандартных стойках с более низким энергопотреблением, и обеспечивает отличную производительность для приложений, масштабируемых от одного до четырех графических процессоров одновременно, включая приложения для вывода ИИ и высокопроизводительных вычислений. Партнеры NVIDIA уже сегодня поставляют сертифицированные NVIDIA серверы с шиной H100 PCIe. Посетите каталог квалифицированных систем , чтобы узнать больше. Ожидается, что системы других партнеров с NVIDIA H100 PCIe и NVIDIA HGX H100 будут сертифицированы NVIDIA позже в этом году. В совокупности эти новые платформы позволяют предприятиям запускать новейшие приложения для ИИ и высокопроизводительных вычислений с еще большей производительностью и большей масштабируемостью. Энергоэффективная производительность для ИИ-видео и логических выводовГрафический процессор NVIDIA Ada Lovelace L4 с тензорными ядрами обеспечивает универсальное ускорение и энергоэффективность для видео, ИИ, виртуальных рабочих станций и графических приложений на предприятии, в облаке и на периферии. А благодаря платформе искусственного интеллекта NVIDIA и подходу с полным стеком графический процессор L4 оптимизирован для обработки видео и логических выводов в масштабе для широкого спектра приложений искусственного интеллекта, чтобы обеспечить наилучшее персонализированное взаимодействие. Чтобы узнать больше, см. статью Повышение производительности ИИ-видео и вывода ИИ с помощью графических процессоров NVIDIA L4 . Являясь наиболее эффективным ускорителем NVIDIA для массовых пользователей, серверы, оснащенные графическим процессором L4, обеспечивают до 120 раз более высокую производительность видео ИИ по сравнению с решениями на базе ЦП, обеспечивая при этом в 2,7 раза более высокую производительность генеративного ИИ. Они обеспечивают более чем в 4 раза большую графическую производительность по сравнению с предыдущим поколением. Графический процессор NVIDIA L4 отличается универсальным энергоэффективным низкопрофильным форм-фактором с одним слотом, что делает его идеальным для периферийных, облачных и корпоративных развертываний. Рисунок 2. Графический процессор NVIDIA L4 повышает производительность видео и ИИ по сравнению с графическим процессором NVIDIA T4 Tensor Core. Вариант использования графического процессора NVIDIA L4 Edge выигрывает от ускорения видео с аппаратными декодерами и кодировщиками, а также ускорения искусственного интеллекта с тензорными ядрами. Они ценны в приложениях для анализа периферийного видео для умных городов, обеспечения качества производства и розничного маркетинга в умных пространствах. Графический процессор L4 специально разработан для удовлетворения требований к ИИ в приложениях для обработки краевых датчиков HPC. Его графическая и видеопроизводительность превосходит визуализацию для научных приложений на периферийном приборе. Графический процессор NVIDIA L4 доступен в сертифицированных NVIDIA системах от партнеров NVIDIA, включая Advantech, ASUS, Atos, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Lenovo, QCT и Supermicro, в более чем 100 уникальных моделях серверов. ЦП следующего поколенияДостижения в технологиях ЦП дополняют новые графические процессоры NVIDIA. Новейшее поколение процессоров включает процессоры Intel Xeon Scalable 4-го поколения, также известные как Sapphire Rapids, а также процессоры AMD EPYC 4-го поколения, также известные как Genoa. Эти новейшие архитектуры обладают возможностями, которые позволяют предприятиям запускать новейшие приложения ИИ с еще большей производительностью и большим масштабом. Это включает в себя высокую скорость передачи данных по системной шине и более высокую пропускную способность данных из основной памяти. Суперчип NVIDIA Grace Hopper , основанный на архитектуре Arm, обеспечивает превосходную производительность и энергоэффективность. Grace Hopper Superchip, созданный для гигантских ИИ и высокопроизводительных вычислений, оснащен NVLink C2C, чтобы обеспечить согласованную модель памяти ЦП и ГП для ускоренного ИИ. Сертифицированные NVIDIA системы для ускоренных вычисленийПоскольку каждое новое поколение технологий усложняется, потребность в предварительно проверенных решениях для оптимизации сбора данных больше, чем когда-либо. Программа NVIDIA-Certified Systems была создана специально для удовлетворения этой потребности. Сертифицированные системы NVIDIA объединяют графические процессоры NVIDIA и высокоскоростную безопасную сеть NVIDIA с системами от ведущих партнеров NVIDIA в конфигурациях, проверенных на оптимальную производительность, надежность и масштабируемость для различных рабочих нагрузок. Тесты основаны на реальных данных и представляют новейшие приложения с ускорением на GPU, включая обучение глубокому обучению с помощью PyTorch и TensorFlow, высокопроизводительные вычисления, анализ данных с помощью Apache Spark и 3D-вычисления с NVIDIA Omniverse . Сертификация полностью построена на наборе тестов на основе контейнеров с использованием Kubernetes для оркестровки, гарантируя, что любая сертифицированная система может быть легко интегрирована в современные облачные среды управления. Важно понимать разницу между квалификацией и сертификацией NVIDIA. Квалифицированная система прошла температурные, механические испытания, испытания на питание и целостность сигнала, чтобы гарантировать полную функциональность конкретного графического процессора NVIDIA в этой модели сервера. Сертифицированная система прошла ряд тестов для проверки ее производительности для широкого спектра категорий рабочих нагрузок, а также для сетевых функций, безопасности и функций управления. Эти возможности становятся критически важными для любого корпоративного вычислительного решения. Если вы хотите убедиться, что система поддерживается , а также оптимально спроектирована и настроена, выберите сертифицированную систему. Вычислительные платформы нового поколения для предприятийСертифицированные NVIDIA системы от мировых производителей с графическими и центральными технологиями нового поколения доступны уже сегодня. Посетите каталог квалифицированных систем , чтобы узнать, какие модели доступны у предпочитаемого вами поставщика. Об авторе Чару Чаубал (Charu Chaubal ) Чару Чаубал работает в области маркетинга продуктов в группе корпоративных вычислительных платформ в NVIDIA. Он имеет более чем 20-летний опыт работы в области маркетинга, обучения клиентов и предварительной продажи технологических продуктов и услуг. Чару работал в различных областях, таких как облачные вычисления, гиперконвергентная инфраструктура и ИТ-безопасность. В качестве лидера по технологическому маркетингу в VMware он помог запустить множество предложений, которые в совокупности превратились в многомиллиардные компании. Ранее он работал в Sun Microsystems, где разрабатывал программные решения для управления распределенными ресурсами и инфраструктуры высокопроизводительных вычислений. Чару имеет докторскую степень. в химическом машиностроении и является автором нескольких патентов. |
|