Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки

Использование принципа уровней данных в средах RAID-хранилищ

Александр Зейников, представитель компании LSI в России

Введение

Ввиду развития технологии твердотельных накопителей, понижения стоимости скоростной volatile памяти, удешевления SATA -решений и повышения надежности SAS -интерфейсов, стало трудно организовать и интегрировать новые технологии хранения. Есть возможность поместить «горячие» данные, к которым обращаются чаще, на низколатентных, быстрых накопителях, а данные, редко требуемые пользователями, на более дешевые носители с высоким временем отклика.

Так как все эти варианты теперь доступны IT -специалистам в области хранения данных, существует обширный ряд возможностей использовать параметры стоимости, производительности и емкости, чтобы оптимально определить идеальное хранилище для размещения данных, при этом используя инновационные технологии. В данной статье мы обсудим использование уровней хранения данных и как оно может улучшить показатели производительности и надежности в смешанных средах хранения данных, дополняя и улучшая кэш-буфер операционной системы СХД и обеспечивая сокращение издержек.

Современные сервера предлагают множество различных функций, но, хотя мы можем в этом случае обобщать, каждое приложение обеспечивает различную нагрузку. Кроме того, потребности в производительности основываются также на текущей степени нагрузки и требований в области качества сервиса ( QoS ). Несмотря на то, что среды хранения данных имеют больше функциональных возможностей, что позволяет настраивать их под потребности конкретных пользователей, это также усложняет архитектуру СХД и делают планирование производительности хранилищ более сложным. Планирование производительности требует учета производительности операций ввода-вывода ( I / O ), требований к возможностям масштабирования емкости и производительности, характеристики производительности накопителей и массивов данных, средств защиты данных и бюджета.

Больше возможностей – больше контроля

Современные контроллеры СХД имеют широкий ассортимент аппаратных опций: новые и составные типа RAID -массивов, премиальные функции, передовые опции кэширования, а также варианты аппаратного обеспечения для любого бюджета. Встроенные процессоры последних поколений сделали контроллеры СХД еще более функциональными, благодаря расширению функциональных возможностей и адаптации к развивающимся технологиям.

Жесткие диски также предоставляют огромное количество новых возможностей. Интерфейс Serial Attached SCSI ( SAS ) был разработан для того, чтобы интегрировать SATA и SAS для создания кастомизированных СХД, учитывающих индивидуальные требования к показателям производительности и экономичности. Популярность SATA главным образом основывается на оптимальном соотношении стоимости и производительности, хотя с точки зрения общей производительности такие диски обеспечивают самые низкие показатели. SAS предлагает существенно более высокую производительность , но при более высокой стоимости. Другим вариантом носителей данных для организации хранилища служат твердотельные накопители ( SSD ), имеющие интерфейсы SATA и SAS . SSD обеспечивают поразительно высокие показатели производительности при выполнении случайных операций, чем накопители с движущимися частями, но за более высокую цену.

Сложность построения СХД усугубляют результаты производительности различных типов RAID -массивов. Оптимизация СХД под конкретные нагрузки требует соблюдения определенных характеристик производительности операций ввода-вывода и проецирование их на идеальный тип RAID -массива с учетом требований к доступности данных.

Если мы возьмем за основу RAID 10, то можно убедиться в том, что некоторые типы дисков в большей степени подходят для определенного типа приложений, при этом SSD стоят примерно в шесть с половиной раз больше, чем SAS -диск со скоростью вращения шпинделя 15000 оборотов в минуту и интерфейсом 6 Гбит/с – но не все приложения работают в шесть с половиной раз быстрее в реальных рабочих средах.

Каждый IT -специалист в какой-то момент задавал себе один и тот же вопрос: сколько жестких дисков понадобится, чтобы обеспечить производительность, как и быстрый SSD ? Думать об этом легко, но в реальном мире, вероятней всего, только часть емкости хранилища будет доступна в любое данное время. Архитектуры кэширования десятилетиями разрабатывались на основе этой идеи. А что если построить СХД, используя различные типы накопителей, имеющие различные показатели стоимости и производительности?

Все стало жестко

Производители продукции для хранения данных осознают, что при использовании гетерогенных архитектур накопителей, использование нескольких уровней данных с СХД – самое лучшее решение.Использование принципа уровней данных – весьма простая концепция: поместите наиболее часто используемые данные на самые производительные накопители, а т.н. «холодные» данные на более медленные носители. Использование уровней данных отличается от кэширования тем, что емкость всех логических дисков может использоваться полностью для хранения пользовательских данных. В то время как это далеко не новый подход, он не использовался в области топологии СХД, но новые твердотельные технологии хранения открыли новые возможности.

Давайте рассмотрим пример того, как использование принципа уровней данных может оптимизировать среду хранения баз данных. Компания X строит новый SQL -сервер, и из своего прошлого опыта они учитывают следующую информацию:

  • 4 терабайта для хранения данных
  • 3%данных (примерно 125 Гбайт) являются «горячими» - книмобращаютсяв 65% всеговремени
  • 6% (примерно 250 Гбайт) используются в среднем в 25% времени
  • Оставшиеся данные – «холодные данные», к которым обращаются в 15% всего времени
  • База данных доступна в объеме 8 Кбайт, с соотношением чтения и записи примерно 2:1.
  • Для дисков предусмотрены 8 разъемов.

Идеальным и экономичным решением проблемы оптимального размещения этих 4 Тбайт данных является создание логического устройства, которое обеспечивает требуемую производительность каждому уровню данных, как в отношении IOPS , так и времени отклика.

Организация уровней данных

Тип накопителя

Тип RAID

Примерная стоимость

Используемая емкость

Производитель-ность базы данных ( IOPS )

$ на операцию базу данных

3

3x 2TB SATA

RAID 5

$491 , 52

4096 GB

(226 * 10%) = 23

2 , 17

2

3x 146GB 15K SAS

RAID 5

$766 , 50

192 GB

(615 * 25%) = 154

1 , 25

1

2x 64GB SSD

JBOD

$1408

128 GB

(8810 * 65%) = 5726

0, 32

Всего :

 

 

$2666 , 02

4516 GB

5903

0, 45

Рассмотрим гомогенные альтернативы сочетания накопителей:

Организация уровней данных

Тип накопителя

Тип RAID

Примерная стоимость

Используемая емкость

Производитель-ность базы данных ( IOPS )

$ на операцию базу данных

SATA HDD

8x 1TB 7200 RPM

RAID 10

$655 , 36

4096GB

931

$ 0, 71


Организация уровней данных

Тип накопителя

Тип RAID

Примерная стоимость

Используемая емкость

Производитель-ность базы данных ( IOPS )

$ на операцию базу данных

SSD

8x 600GB

RAID 5

$52800

4200GB

16885

$3 , 12


Организация уровней данных

Тип накопителя

Тип RAID

Примерная стоимость

Используемая емкость

Производитель-ность базы данных ( IOPS )

$ на операцию базу данных

SAS HDD

8x 600GB 15K RPM

RAID 5

$8400

4200GB

1802

$4,66


Ниже приводится сравнение трех вариантов построения СХД . Очевидно, что трехуровневая структура хранилища не только демонстрирует самые низкие показатели стоимости одной операции базы данных, но и обеспечивает примерно в шесть раз более высокую производительность IOPS , чем гомогенное решение на основе SATA и в три раза выше, чем гомогенная структура на SAS , приэтомпредоставляя больше емкости, чем другие предложения.

Организация СХД

Стоимость решения

Используемая емкость

Производительность базы данных (IOPS)

$ за операцию базы данных

Уровневая

$2666

4516 GB

5903

$0 , 45

Только SATA

$655

4096 GB

931

$0 , 71

Только SSD

$52800

4200 GB

16885

$3 , 12

15K SAS

$8400

4200 GB

1802

$4 , 66

Многие решения можно построить, принимая во внимание ограничения по производительности, стоимости, емкости или пространства. Этот пример всего лишь отображает, какие возможности экономии открываются при использовании уровневого решения. Конечно, можно построить такое решение вручную, принимая во внимание такие факторы:

  1. Вы уже точно знаете, какие файлы будут использоваться часто
  2. Вы имеете возможность физически разделить данные на различные носители
  3. «Горячиеданные» не transient или динамичны.

«За» и «против» использования уровней данных

Использование принципа уровня данных объединяет в себе лучшие характеристики нескольких технологий. Используя различные типы накопителей, можно оптимизировать издержки и производительность, а также сохранить доступное пространство сервера. Подумайте: чтобы достичь производительности ввода-вывода в базе данных, обеспечиваемой трехуровневой структурой, в гомогенных структурах вам понадобится более 50 SATA -дисков, что значительно повысить требования СХД в плане стоечного пространства и энергообеспечения. Использование уровней данных позволяет построить динамичную интеллектуальную среду, где часто используемые данные постоянно автоматически помещаются на более производительные накопители. Есть даже возможность помещать наиболее критично важные данные на массивы с самой высокой доступностью или копировать данные, доступ к которым осуществляется из географически удаленных местоположений, на локальные хранилища.

Несмотря на все преимущества использования уровней данных, есть и некоторые недостатки. Даже если функции идентификации и надлежащего переноса данных осуществляются автоматически, построение СХД для ваших конкретных нужд в настоящем и будущем, должно быть выполнено профессионалом в области хранения данных. Другим потенциальным недостатком может быть то, что при использовании модели уровней данных, даже при том что логический том будет опознаваться как один, он может располагаться на различных физических носителях. Однако при использовании аппаратной защиты RAID , можно добиться снижения возможностей утери данных.

Сейчас в плане технологий хранения наступил «идеальный шторм»: быстро растет потребность в повышенной емкости СХД, появляется беспрецедентное множество типов накопителей, повышаются требования к производительности ввиду большого количества цифровых транзакций в корпоративном сегменте, растет плотность обработки данных, а также необходимость обеспечить безопасность ценных данных и других корпоративных активов. Использование уровней данных позволяет вам ощутить преимущества низкой стоимости хранения данных SATA -дисков, надежности и безопасности SAS -накопителей и высокой производительности SSD в одном решении.

Публикации по теме
Современные СХД
 
Новости LSI

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.