Использование принципа уровней данных в средах RAID-хранилищ
Введение Ввиду развития технологии твердотельных накопителей, понижения стоимости скоростной volatile памяти, удешевления SATA -решений и повышения надежности SAS -интерфейсов, стало трудно организовать и интегрировать новые технологии хранения. Есть возможность поместить «горячие» данные, к которым обращаются чаще, на низколатентных, быстрых накопителях, а данные, редко требуемые пользователями, на более дешевые носители с высоким временем отклика. Так как все эти варианты теперь доступны IT -специалистам в области хранения данных, существует обширный ряд возможностей использовать параметры стоимости, производительности и емкости, чтобы оптимально определить идеальное хранилище для размещения данных, при этом используя инновационные технологии. В данной статье мы обсудим использование уровней хранения данных и как оно может улучшить показатели производительности и надежности в смешанных средах хранения данных, дополняя и улучшая кэш-буфер операционной системы СХД и обеспечивая сокращение издержек. Современные сервера предлагают множество различных функций, но, хотя мы можем в этом случае обобщать, каждое приложение обеспечивает различную нагрузку. Кроме того, потребности в производительности основываются также на текущей степени нагрузки и требований в области качества сервиса ( QoS ). Несмотря на то, что среды хранения данных имеют больше функциональных возможностей, что позволяет настраивать их под потребности конкретных пользователей, это также усложняет архитектуру СХД и делают планирование производительности хранилищ более сложным. Планирование производительности требует учета производительности операций ввода-вывода ( I / O ), требований к возможностям масштабирования емкости и производительности, характеристики производительности накопителей и массивов данных, средств защиты данных и бюджета. Больше возможностей – больше контроля Современные контроллеры СХД имеют широкий ассортимент аппаратных опций: новые и составные типа RAID -массивов, премиальные функции, передовые опции кэширования, а также варианты аппаратного обеспечения для любого бюджета. Встроенные процессоры последних поколений сделали контроллеры СХД еще более функциональными, благодаря расширению функциональных возможностей и адаптации к развивающимся технологиям. Жесткие диски также предоставляют огромное количество новых возможностей. Интерфейс Serial Attached SCSI ( SAS ) был разработан для того, чтобы интегрировать SATA и SAS для создания кастомизированных СХД, учитывающих индивидуальные требования к показателям производительности и экономичности. Популярность SATA главным образом основывается на оптимальном соотношении стоимости и производительности, хотя с точки зрения общей производительности такие диски обеспечивают самые низкие показатели. SAS предлагает существенно более высокую производительность , но при более высокой стоимости. Другим вариантом носителей данных для организации хранилища служат твердотельные накопители ( SSD ), имеющие интерфейсы SATA и SAS . SSD обеспечивают поразительно высокие показатели производительности при выполнении случайных операций, чем накопители с движущимися частями, но за более высокую цену. Сложность построения СХД усугубляют результаты производительности различных типов RAID -массивов. Оптимизация СХД под конкретные нагрузки требует соблюдения определенных характеристик производительности операций ввода-вывода и проецирование их на идеальный тип RAID -массива с учетом требований к доступности данных. Если мы возьмем за основу RAID 10, то можно убедиться в том, что некоторые типы дисков в большей степени подходят для определенного типа приложений, при этом SSD стоят примерно в шесть с половиной раз больше, чем SAS -диск со скоростью вращения шпинделя 15000 оборотов в минуту и интерфейсом 6 Гбит/с – но не все приложения работают в шесть с половиной раз быстрее в реальных рабочих средах. Каждый IT -специалист в какой-то момент задавал себе один и тот же вопрос: сколько жестких дисков понадобится, чтобы обеспечить производительность, как и быстрый SSD ? Думать об этом легко, но в реальном мире, вероятней всего, только часть емкости хранилища будет доступна в любое данное время. Архитектуры кэширования десятилетиями разрабатывались на основе этой идеи. А что если построить СХД, используя различные типы накопителей, имеющие различные показатели стоимости и производительности? Все стало жестко Производители продукции для хранения данных осознают, что при использовании гетерогенных архитектур накопителей, использование нескольких уровней данных с СХД – самое лучшее решение.Использование принципа уровней данных – весьма простая концепция: поместите наиболее часто используемые данные на самые производительные накопители, а т.н. «холодные» данные на более медленные носители. Использование уровней данных отличается от кэширования тем, что емкость всех логических дисков может использоваться полностью для хранения пользовательских данных. В то время как это далеко не новый подход, он не использовался в области топологии СХД, но новые твердотельные технологии хранения открыли новые возможности. Давайте рассмотрим пример того, как использование принципа уровней данных может оптимизировать среду хранения баз данных. Компания X строит новый SQL -сервер, и из своего прошлого опыта они учитывают следующую информацию:
Идеальным и экономичным решением проблемы оптимального размещения этих 4 Тбайт данных является создание логического устройства, которое обеспечивает требуемую производительность каждому уровню данных, как в отношении IOPS , так и времени отклика.
Рассмотрим гомогенные альтернативы сочетания накопителей:
Ниже приводится сравнение трех вариантов построения СХД . Очевидно, что трехуровневая структура хранилища не только демонстрирует самые низкие показатели стоимости одной операции базы данных, но и обеспечивает примерно в шесть раз более высокую производительность IOPS , чем гомогенное решение на основе SATA и в три раза выше, чем гомогенная структура на SAS , приэтомпредоставляя больше емкости, чем другие предложения.
Многие решения можно построить, принимая во внимание ограничения по производительности, стоимости, емкости или пространства. Этот пример всего лишь отображает, какие возможности экономии открываются при использовании уровневого решения. Конечно, можно построить такое решение вручную, принимая во внимание такие факторы:
«За» и «против» использования уровней данных Использование принципа уровня данных объединяет в себе лучшие характеристики нескольких технологий. Используя различные типы накопителей, можно оптимизировать издержки и производительность, а также сохранить доступное пространство сервера. Подумайте: чтобы достичь производительности ввода-вывода в базе данных, обеспечиваемой трехуровневой структурой, в гомогенных структурах вам понадобится более 50 SATA -дисков, что значительно повысить требования СХД в плане стоечного пространства и энергообеспечения. Использование уровней данных позволяет построить динамичную интеллектуальную среду, где часто используемые данные постоянно автоматически помещаются на более производительные накопители. Есть даже возможность помещать наиболее критично важные данные на массивы с самой высокой доступностью или копировать данные, доступ к которым осуществляется из географически удаленных местоположений, на локальные хранилища. Несмотря на все преимущества использования уровней данных, есть и некоторые недостатки. Даже если функции идентификации и надлежащего переноса данных осуществляются автоматически, построение СХД для ваших конкретных нужд в настоящем и будущем, должно быть выполнено профессионалом в области хранения данных. Другим потенциальным недостатком может быть то, что при использовании модели уровней данных, даже при том что логический том будет опознаваться как один, он может располагаться на различных физических носителях. Однако при использовании аппаратной защиты RAID , можно добиться снижения возможностей утери данных. Сейчас в плане технологий хранения наступил «идеальный шторм»: быстро растет потребность в повышенной емкости СХД, появляется беспрецедентное множество типов накопителей, повышаются требования к производительности ввиду большого количества цифровых транзакций в корпоративном сегменте, растет плотность обработки данных, а также необходимость обеспечить безопасность ценных данных и других корпоративных активов. Использование уровней данных позволяет вам ощутить преимущества низкой стоимости хранения данных SATA -дисков, надежности и безопасности SAS -накопителей и высокой производительности SSD в одном решении. |
|