Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
Lenovo: модель и оркестрация, разработанная для систем искусственного интеллекта следующего поколения

2, август 2023  — 

Рабочие нагрузки искусственного интеллекта ( ИИ ) и машинного обучения ( МО ) требуют от организаций управления как кодом , так и массивными наборами данных . Для многих команд создание и запуск систем ИИ является сложной задачей по следующим причинам :

  • длительное время обучения модели;
  • необходимость массивного управления данными;
  • необходимость поддержки оркестрации управления рабочей нагрузкой и запуском заданиями;
  • необходимость управления релизами и конфигурацией в отношении данных , а также цепочки инструментов ;
  • требуются огромные инвестиции в инфраструктуру , которая недоступна для стартапов и новаторов .

Все эти проблемы решаются в Lenovo TruScale HPC для инфраструктуры искусственного интеллекта как услуга . Lenovo вместе с нашими партнерами , WEKA и UbiOps, предоставляет командам высокопроизводительных вычислений и искусственного интеллекта мощное готовое решение для развертывания , обучения и управления моделями и рабочими процессами машинного и глубокого обучения .

Данное решение позволяет легко управлять , запускать и масштабировать рабочие нагрузки искусственного интеллекта и машинного обучения на Lenovo HPC с помощью WEKA Data Platform и UbiOps за счет:

  • поддержки масштабируемых систем ML/AI промышленного уровня, а также развертывания моделей ИИ и их обучение до 10 раз быстрее . Управление бесчисленными рабочими нагрузками ИИ одновременно из единой плоскости управления ;
  • снижения совокупной стоимости существующего решения и повышения его производительности . Достижение более быстрой конвергенции в цикле разработки модели и сокращение ее выхода на рынок ;
  • возможность использования масштабируемой распределенной инфраструктуры данных и вычислений даже для самых ресурсоемких рабочих нагрузок ;
  • получения доступа по запросу ко всему стеку высокопроизводительных вычислений Lenovo в локальной среде и в гибридном облаке . Lenovo TruScale HPC дает возможность сосредоточиться на своей основной деятельности и не беспокоиться об управлении аппаратным и программным стеком .
Создание и запуск систем искусственного интеллекта — сложная задача

Рабочие нагрузки AI и ML требуют от организаций управления как кодом , так и массивными наборами данных . Для многих команд создание и запуск систем ИИ является сложной задачей : много времени уходит на обучение моделей , управление данными , управление рабочими нагрузками и оркестровку в сложной облачной среде , перерасход средств и работу с большими конвейерами данных , среди прочего . Все эти проблемы требуют ресурсов и денег для управления операциями .

Чтобы преодолеть эти проблемы , Lenovo HPC, WEKA и UbiOps предоставляют командам высокопроизводительных вычислений и искусственного интеллекта мощное готовое решение для развертывания , обучения и управления моделями и рабочими процессами машинного и глубокого обучения .

Независимо от того , находитесь ли вы в начале пути к HPC/AI или уже интегрировали AI/ML в свою организацию , вы можете извлечь выгоду из этого решения и начать запускать приложения , интенсивно использующие данные , в реальном времени уже сегодня :

  • обучайте , развертывайте и управляйте всеми своими моделями обработки данных и машинного обучения в готовой производственной среде с масштабируемой вычислительной инфраструктурой .
  • масштабируйте свои рабочие нагрузки ИИ динамически по мере использования и легко увеличивайте их с помощью функции автоматического масштабирования .
  • используйте современный высокопроизводительный графический процессор для ускорения глубокого обучения .
  • создавайте и организуйте рабочие процессы — повторно используйте и делитесь шагами и данными модульного конвейера .
  • обучайте модели , используя данные в петабайтном масштабе локально и / или в гибридном облаке .
  • получите доступ по запросу к мощному оборудованию с бессерверным распределением рабочей нагрузки . Развертывайте модели в собственной инфраструктуре или частном облаке или масштабируйте их до гибридных и многооблачных сред , чтобы оптимизировать затраты , соответствие требованиям и производительность .
Проблемы

Группы обработки данных и искусственного интеллекта как в крупных , так и в небольших организациях часто сталкиваются с одними и теми же проблемами , когда речь идет о разработке и развертывании систем искусственного интеллекта и машинного обучения в масштабе :

  • Инфраструктура . Правильная инфраструктура для запуска моделей машинного обучения , масштабирования и обработки больших объемов данных в условиях производственного уровня часто требует огромных затрат времени и ресурсов DevOps/ ИТ .
  • Качество данных . Поддержание качества данных , используемых для обучения и тестирования моделей , имеет решающее значение для AI и ML.
  • Приложения : может быть сложно обеспечить согласованность , точность и актуальность данных в любом масштабе .
  • Управление версиями модели . Отслеживание различных моделей и их производительности может быть затруднено , особенно по мере увеличения числа развернутых моделей .
  • Сотрудничество : сотрудничество между специалистами по данным и операционными командами может стать сложным и неэффективным .
  • Мониторинг и отладка . Мониторинг производительности моделей машинного обучения в производственных средах и отладка возникающих проблем могут занимать очень много времени и быть сложными .
  • Безопасность и соответствие требованиям . Обеспечение безопасного развертывания и управления моделями машинного обучения в соответствии с требованиями имеет решающее значение , но это может быть сложно достичь в масштабе .
  • Отсутствие автоматизации . Наука о данных и машинное обучение часто по - прежнему требуют ручных процессов , которые могут занимать много времени и приводить к ошибкам . Автоматизация необходима для масштабирования процессов MLOps.
  • Ограниченные ресурсы : организациям может потребоваться больше ресурсов для MLOps, что затрудняет масштабирование .
  • Гибридное облако и локальное развертывание . Работа с несколькими средами , в которых находятся ваши данные и вычислительные ресурсы , может оказаться очень сложной задачей для многих команд .

Новейшее вычислительное решение ИИ для приложений высокопроизводительного ИИ и машинного обучения

Lenovo, WEKA и UbiOps объединили усилия , чтобы предложить лучшее в своем классе решение для решения этих задач . Это решение динамически распределяет ресурсы для всего рабочего процесса ; следовательно , управляет как инфраструктурой для вашего развития , так и вашими операционными потребностями .

Len_UbiOps_Weka_visual.png

Рис . 1. Вычислительное решение ИИ для приложений высокопроизводительного ИИ и машинного обучения

Преимущества, предоставляемые UbiOps

UbiOps предоставляет вашей команде мощные возможности обслуживания и оркестровки моделей ИИ с непревзойденной простотой , скоростью и масштабируемостью . Он позволяет управлять , обучать и выполнять бесчисленное количество заданий AI/ML одновременно из единой плоскости управления .

UbiOps позволяет специалистам по данным легко совместно работать над моделями , данными и рабочими процессами . Он поставляется с множеством встроенных функций MLOps, таких как контроль версий , простой откат , мониторинг и ведение журнала для развернутых моделей и заданий . UbiOps как интегрированное решение MLOps повышает производительность вашей команды и сокращает время выхода на рынок решений и продуктов ИИ .

Более того , UbiOps можно использовать как SaaS или устанавливать в гибридных облачных средах . Получите доступ по запросу к мощному оборудованию ЦП и ГП с помощью бессерверного распределения рабочей нагрузки в нескольких облаках . Оптимизируйте вычислительные узлы в соответствии с вашими моделями и создавайте модульные оптимизированные конвейеры с помощью нашего инструмента управления рабочими процессами данных .

Обзор преимуществ Lenovo и WEKA

WEKA создала программно - определяемую платформу данных , которая использует передовые серверы и системы хранения Lenovo, а также быстрые сетевые технологии , чтобы раскрыть ценность ваших данных .

Платформа данных WEKA, работающая на серверах Lenovo, обеспечивает постоянный молниеносный доступ к данным в масштабах от терабайтов до эксабайтов , когда это необходимо в рабочем процессе ИИ . Этот быстрый доступ поддерживается отмеченной наградами аппаратной платформой Lenovo TruScale, а запатентованная архитектура поддерживает как малые , так и очень большие конфигурации без ущерба для производительности . Платформа данных WEKA устраняет необходимость в нескольких вариантах хранения и копиях данных для рабочих процессов MLOps, снижая сложность операций , повышая эффективность конвейера и увеличивая использование графического процессора .

Единая платформа данных WEKA поддерживает все популярные методы доступа к данным , включая файловую систему , совместимую с POSIX, NFS, SMB, S3, CSI для Kubernetes и прямое хранилище GPU ( для прямого перемещения данных между графическими процессорами и хранилищем ). Кроме того , благодаря SDDP он обеспечивает развертывание как в локальной среде , в частном облаке , так и в гибридном облаке . WEKA также перемещает данные между различными облачными конфигурациями .

Len_Weka diagram.jpg

Рисунок 2. Рабочий процесс WEKA

Дополнительные преимущества включают в себя :

  • Эффективное перемещение и резервное копирование данных . Расширенные возможности управления данными обеспечивают быстрое и эффективное перемещение данных между различными узлами и упрощают резервное копирование в локальные или удаленные облачные регионы .
  • Уровневая автоматизация . WEKA может автоматически размещать холодные данные в недорогом объектном хранилище , локально или в облаке для повышения экономической эффективности . Все данные остаются в пространстве имен , а метаданные остаются на уровне флэш - памяти для быстрого доступа .
  • Обеспечение безопасности . Платформа данных WEKA была разработана для обеспечения безопасности ваших данных с помощью расширенной аутентификации , шифрования во время передачи и хранения , а также гибкого управления ключами .
Преимущества Lenovo TruScale

Lenovo TruScale для высокопроизводительных вычислений обеспечивает упрощенный доступ к технологии высокопроизводительных вычислений благодаря гибкой модели по требованию , объединяющей оборудование , программное обеспечение и услуги в единое настраиваемое решение с предсказуемой и доступной регулярной оплатой .

Предоставляемый как услуга , TruScale HPC помогает ускорить внедрение инноваций , предоставляя доступ к новейшим передовым решениям в рамках модели без риска , без сюрпризов и с оплатой по мере роста . По сути , он сочетает в себе лучшее из локальной и облачной среды в одном решении .

Преимущества очевидны . Во - первых , нет необходимости в капитальных вложениях , и вы можете избежать длительных циклов закупок с нашей моделью OPEX. Кроме того , TruScale упрощает управление центром обработки данных и предоставление ИТ - ресурсов , снижая бюджетные и кадровые ограничения . Это дает вам время и ресурсы , чтобы сосредоточиться на ускорении бизнес - результатов и достижении конкурентных преимуществ . Управляемые услуги TruScale HPC позаботятся об обновлениях , обслуживании и планах расширения для клиента . Поэтому вы сосредотачиваетесь на своей основной компетенции , в то время как Lenovo предоставляет инфраструктуру вместе с нашими партнерами .

Некоторые из преимуществ Lenovo HPC включают в себя :

  • сервер № 1 по надежности семь лет подряд;
  • поставки продуктов шести из 10 крупнейших гиперскейлеров в мире ;
  • сертификаты и охват более чем 100 рынков ;
  • модель централизованного финансирования / выставления счетов / заключения контрактов / доставки для поддержки сложных глобальных сделок ;
  • действуют хорошо зарекомендовавшие себя программы предоставления услуг .

Рис . 3. Пример архитектуры TruScale HPC

Заключение

Lenovo, WEKA и UbiOps объединили свои усилия , чтобы предоставить комплексное решение для запуска , управления и координации рабочих нагрузок AI/ML с интенсивным использованием данных , а также предоставить возможности MLOps группам специалистов по обработке и анализу данных. Среди преимуществ решения :

  • объединяет разрозненные стеки в единую управляемую платформу данных , работающую локально и / или в гибридном облаке ;
  • предназначено для развертывания , запуска и управления современными решениями AI/ML в масштабе ;
  • предоставляет вашей команде возможности MLOps для захвата и отслеживания всех артефактов проекта , включая код , версии пакетов и параметры , для обеспечения полной видимости , повторяемости и воспроизводимости в любое время как для разработки модели , так и для управления официальным выпуском ;
  • включает в себя полностью управляемые , лучшие в своем классе автоматически масштабируемые хранилища и вычислительные узлы , чтобы ваша команда могла быть спокойной и сосредоточиться на своих компетенциях , а не на повседневных задачах инфраструктуры .

Выставление счетов на основе потребления делает это не только мощным , но и очень экономичным решением для организаций любого размера , чтобы дать толчок их пути AI/ML.

Об авторе

Марк Азадпур ( Mark Azadpour )— старший менеджер по стратегическим продуктам TruScale в Lenovo, специализирующийся на высокопроизводительных вычислениях , искусственном интеллекте , виртуализации ( облаке ) и программно - определяемой инфраструктуре . Он имеет многолетний опыт работы с корпоративным программным и аппаратным обеспечением и имеет докторскую степень . В компьютерной инженерии и MBA в стратегическом маркетинге .

Товарные знаки

Lenovo и логотип Lenovo являются товарными знаками или зарегистрированными товарными знаками Lenovo в США и / или других странах . Текущий список товарных знаков Lenovo доступен в Интернете по адресу https://www.lenovo.com/us/en/legal/copytrade/ .

Следующие термины являются товарными знаками Lenovo в США и / или других странах :
Lenovo®

Другие названия компаний , продуктов или услуг могут быть товарными знаками или знаками обслуживания других лиц .

Публикации по теме
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
 
Новости Lenovo

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.