Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
VMware и NVIDIA открывают возможности генеративного искусственного интеллекта для предприятий

22, август 2023  —  VMware , Inc . (NYSE: VMW) и NVIDIA (NASDAQ: NVDA) сегодня объявили о расширении своего стратегического партнерства, чтобы подготовить сотни тысяч предприятий, работающих в облачной инфраструктуре VMware, к эпохе генеративного искусственного интеллекта. .

VMware Private AI Foundation совместно с NVIDIA позволит предприятиям настраивать модели и запускать генеративные приложения искусственного интеллекта, включая интеллектуальных чат-ботов, помощников, средства поиска и обобщения. Платформа будет полностью интегрированным решением с генеративным программным обеспечением для искусственного интеллекта и ускоренными вычислениями от NVIDIA, построенным на базе VMware Cloud Foundation и оптимизированным для искусственного интеллекта.

«Генераторный искусственный интеллект и мультиоблачность — идеальное сочетание», — сказал Рагху Рагурам ( Raghu Raghuram ), генеральный директор VMware. «Данные клиентов находятся повсюду — в центрах обработки данных, на периферии и в облаках. Вместе с NVIDIA мы предоставим предприятиям возможность уверенно выполнять генеративные рабочие нагрузки ИИ рядом с их данными, одновременно решая проблемы конфиденциальности, безопасности и контроля корпоративных данных».

«Предприятия во всем мире стремятся интегрировать генеративный искусственный интеллект в свой бизнес», — сказал Дженсен Хуанг ( Jensen Huang ), основатель и генеральный директор NVIDIA. «Наше расширенное сотрудничество с VMware предложит сотням тысяч клиентов — в сфере финансовых услуг, здравоохранения, производства и т. д. — полнофункциональное программное обеспечение и вычисления, необходимые им для раскрытия потенциала генеративного искусственного интеллекта с использованием пользовательских приложений, созданных на основе их собственных данных».

Полнофункциональные вычисления для усиления генеративного искусственного интеллекта

Чтобы быстрее достичь бизнес-преимуществ, предприятия стремятся оптимизировать разработку, тестирование и развертывание генеративных приложений искусственного интеллекта. По оценкам McKinsey, генеративный искусственный интеллект может ежегодно приносить мировой экономике до 4,4 триллиона долларов 1 .

VMware Private AI Foundation совместно с NVIDIA позволит предприятиям использовать эту возможность, настраивая большие языковые модели; создание более безопасных и частных моделей для внутреннего использования; предложение генеративного искусственного интеллекта в качестве услуги своим пользователям; и более безопасно выполнять рабочие нагрузки вывода в любом масштабе.

Ожидается, что платформа будет включать в себя интегрированные инструменты искусственного интеллекта, которые позволят предприятиям экономически эффективно использовать проверенные модели, обученные на их личных данных. Платформа, построенная на базе VMware Cloud Foundation и программного обеспечения NVIDIA AI Enterprise , будет включать в себя следующие ожидаемые преимущества:

  • Конфиденциальность — позволит клиентам легко запускать службы искусственного интеллекта там, где у них есть данные, с архитектурой, которая сохраняет конфиденциальность данных и обеспечивает безопасный доступ.
  • Выбор. У предприятий будет широкий выбор, где создавать и запускать свои модели — от NVIDIA NeMo™ до Llama 2 и более поздних версий, включая ведущие конфигурации OEM-оборудования, а в будущем — в публичном облаке и предложениях поставщиков услуг.
  • Производительность. Работа на ускоренной инфраструктуре NVIDIA обеспечивает производительность, равную, а в некоторых случаях даже превосходящую производительность «голого железа», как было доказано в последних отраслевых тестах .
  • Масштабирование центра обработки данных. Оптимизация масштабирования графических процессоров в виртуализированных средах позволит масштабировать рабочие нагрузки ИИ до 16 виртуальных графических процессоров/графических процессоров в одной виртуальной машине и на нескольких узлах, чтобы ускорить тонкую настройку и развертывание генеративной модели ИИ.
  • Снижение затрат. Максимизирует использование всех вычислительных ресурсов: графических процессоров, процессоров и процессоров для снижения общих затрат и создания объединенной среды ресурсов, которую можно будет эффективно использовать между командами.
  • Ускоренное хранилище. Архитектура хранения данных VMware vSAN Express предоставит оптимизированное по производительности хранилище NVMe и поддерживает хранилище GPUDirect® через RDMA, что позволяет осуществлять прямую передачу ввода-вывода из хранилища на графические процессоры без участия ЦП.
  • Ускоренная работа в сети. Глубокая интеграция между vSphere и технологией NVIDIA NVSwitch™ позволит моделям с несколькими графическими процессорами работать без узких мест между графическими процессорами.
  • Быстрое развертывание и время окупаемости — образы и хранилище образов виртуальных машин vSphere Deep Learning обеспечат возможности быстрого прототипирования, предлагая стабильный готовый образ решения, включающий в себя предварительно установленные платформы и библиотеки, оптимизированные для производительности.

Платформа будет оснащена NVIDIA NeMo , комплексной облачной средой, включенной в NVIDIA AI Enterprise — операционную систему платформы NVIDIA AI — которая позволяет предприятиям создавать, настраивать и развертывать генеративные модели ИИ практически где угодно. NeMo сочетает в себе платформы настройки, наборы инструментов защиты, инструменты управления данными и предварительно обученные модели, чтобы предложить предприятиям простой, экономичный и быстрый способ внедрения генеративного искусственного интеллекта.

Для развертывания генеративного искусственного интеллекта в производстве NeMo использует TensorRT для больших языковых моделей (TRT-LLM), который ускоряет и оптимизирует производительность вывода на новейших LLM на графических процессорах NVIDIA. С помощью NeMo VMware Private AI Foundation совместно с NVIDIA позволит предприятиям использовать собственные данные для создания и запуска пользовательских моделей генеративного ИИ в гибридной облачной инфраструктуре VMware.

На выставке VMware Explore 2023 компании NVIDIA и VMware расскажут, как разработчики на предприятиях могут использовать новый NVIDIA AI Workbench для извлечения моделей сообщества, таких как Llama 2, доступных на Hugging Face , удаленной настройки их и развертывания генеративного ИИ промышленного уровня в средах VMware.

Широкая поддержка экосистемы для VMware Private AI Foundation с NVIDIA

VMware Private AI Foundation с NVIDIA будет поддерживаться Dell Technologies, Hewlett Packard Enterprise (HPE) и Lenovo, которые будут одними из первых, кто предложит системы, которые ускорят корпоративную настройку LLM и рабочие нагрузки вывода с помощью графических процессоров NVIDIA L40S и DPU NVIDIA BlueField® - 3 . и NVIDIA ConnectX®-7 SmartNIC .

Графический процессор NVIDIA L40S обеспечивает до 1,2 раза большую производительность генеративного вывода искусственного интеллекта и до 1,7 раза большую производительность обучения по сравнению с графическим процессором NVIDIA A100 Tensor Core.

DPU NVIDIA BlueField-3 ускоряют, разгружают и изолируют огромную вычислительную нагрузку, связанную с виртуализацией, сетями, хранилищем, безопасностью и другими облачными службами искусственного интеллекта, от графического процессора или процессора.

NVIDIA ConnectX-7 SmartNIC обеспечивает интеллектуальную, ускоренную работу в сети для инфраструктуры центров обработки данных, ускоряя некоторые из самых требовательных в мире рабочих нагрузок искусственного интеллекта.

VMware Private AI Foundation совместно с NVIDIA опирается на десятилетнее партнерство компаний. Их совместная работа оптимизировала облачную инфраструктуру VMware для работы NVIDIA AI Enterprise с производительностью, сравнимой с производительностью «голого железа». Совместные клиенты получают дополнительную выгоду от управления ресурсами и инфраструктурой, а также от гибкости, обеспечиваемой VMware Cloud Foundation.

Доступность

VMware намерена выпустить VMware Private AI Foundation совместно с NVIDIA в начале 2024 года.

Цитаты

1. « Экономический потенциал генеративного искусственного интеллекта: следующий рубеж производительности », McKinsey, 2023 г.

О NVIDIA
С момента своего основания в 1993 году компания NVIDIA (NASDAQ: NVDA) была пионером в области ускоренных вычислений. Изобретение компанией графического процессора в 1999 году спровоцировало рост рынка игр для ПК, изменило определение компьютерной графики, положило начало эре современного искусственного интеллекта и стимулирует цифровизацию промышленности на всех рынках. NVIDIA теперь представляет собой полнофункциональную вычислительную компанию, предлагающую предложения масштаба центров обработки данных, которые меняют отрасль. Дополнительную информацию можно найти на https://nvidianews.nvidia.com/ .

О VMware
VMware — ведущий поставщик мультиоблачных услуг для всех приложений, обеспечивающий цифровые инновации и корпоративный контроль. Являясь надежной основой для ускорения инноваций, программное обеспечение VMware дает предприятиям гибкость и выбор, необходимые для построения будущего. Компания VMware со штаб-квартирой в Пало-Альто, Калифорния, стремится построить лучшее будущее посредством реализации Повестки дня компании на период до 2030 года. Для получения дополнительной информации посетите www.vmware.com/company .

Публикации по теме
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
 
Новости Vmware

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.