Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
КРОК: резервное копирование на практике

30, апрель 2013  — 

Обзор особенностей решений EMC BRS (Backup & Recovery Systems – системы резервного копирования/восстановления), а также ряда их внедрений, осуществленных компанией КРОК.
Сергей Верчёнов, инженер департамента вычислительных систем компании КРОК.

Введение

Резервное копирование (РК) критически важных данных – одна из ключевых задач для всех сегментов рынка без исключения – от SMB до Enterprise. Компания КРОК достаточно давно и успешно строит решения по защите данных и созданию резервных копий на базе аппаратных и программных продуктов EMC. Данная статья – об этих решениях и примерах их внедрения.

Резервное копирование бизнес-критичных приложений в ЦОДах

На сегодняшний день организация резервного копирования в крупных ЦОДах – задача довольна простая. Однако с другой стороны, для ее решения требуется соблюдение целого ряда условий, среди которых:

  • обеспечение максимальной скорости и большого количества одновременных потоков записи;
  • реализация возможности полной разгрузки продукционных систем от задач резервного копирования;
  • консолидация всех операций резервного копирования в одной системе, хорошо масштабируемой и соответствующей высоким темпам роста данных;
  • выполнение заданных показателей RTO/RPO;
  • защищенность систем хранения резервных копий как от выхода из строя отдельных компонент, так и всей системы или площадки, а также от логических сбоев;
  • минимизация стоечного пространства, энергопотребления и ресурсов по кондиционированию в ЦОД.

Для задачи сохранения места в стойках и повышения эффективности используемого пространства – решения EMC подходят как нельзя лучше. За счет интеллектуальной дедупликации блоками переменной длины аппаратные комплексы EMC, например, Data Domain, позволяют высвободить столь ценное в ЦОДе место, используемое под резервные копии. В сравнении с библиотеками класса high-end экономия стоечного места в unit'ах может доходить до десятков раз.

Что касается остальных обозначенных выше задач, то все их с успехом реализует флагман модельного ряда EMC – система Data Domain 990 (DD990), имеющая скорость записи по FC/VTL – 15 Тбайт/ч, а по 10GigE/BOOST – 31 Тбайт/ч. С этими показателями EMC Data Domain занимает первое место по производительности среди одноконтроллерных систем хранения резервных копий. Производительность и масштабируемость системы рассчитаны на крупные предприятия, перед которыми стоит задача консолидации операций резервного копирования в единой системе.

Основными технические характеристики систем EMC Data Domain 990:

  • максимальный логический объем для хранения резервных копий может достигать нескольких десятков петабайт (благодаря появлению новых полок ES30 с дисками по 3 Tбайт);
  • количество одновременных потоков записи – до 540 (что позволяет достичь скорости записи до 31 Тбайт/ч), количество параллельных потоков чтения – до 150.

В настоящее время анонсирована и новая версия DD OS (Data Domain Operating System) – 5.3, которая позволит расширить и без того достаточно объемный список опций. Среди них:

  • возможность использования Data Domain Boost по протоколу Fibre Channel, что позволяет частично переносить функционал дедупликации с целевого устройства на медиа-серверы, существенно увеличивая производительность резервного копирования;
  • технология Advanced Oracle Deduplication, позволяющая использовать мультиплексирование потоков резервного копирования при использовании RMAN без негативного влияния на дедупликацию;
  • новые возможности шифрования – добавлена поддержка локального управления ключами с их ротацией (до 254 ключей);
  • долгосрочное хранение резервных копий. Функциональность длительного хранения, ранее доступная только в специализированных системах Data Domain Archiver, благодаря дополнительной опции Data Domain Extended Retention теперь доступна и пользователям систем DD860 и DD990;
  • сквозная проверка целостности данных. Системы EMС Data Domain были изначально разработаны как специализированные системы "последнего шанса", позволяющие в критической ситуации обеспечить надежное восстановление данных. Начиная с последних версий DDOS, системы Data Domain в обязательном порядке проверяют целостность как метаинформации, так и собственно резервных копий, сразу же после записи на диск;
  • контроль объема хранимых резервных копий, возможность устанавливать квоты на логический объем резервных копий на уровне MTree;
  • возможность построения катастрофоустойчивых архитектур резервного копирования с использованием Symantec NetBackup Auto-Image Replication (AIR).

Заметим, что вся линейка DD от EMC имеет прозрачную масштабируемость, благодаря чему пользователи могут как модернизировать модели контроллеров Data Domain, так и наращивать емкость внутри модели путем добавления полок.

Все эти уникальные возможности помогают осуществлять интересные проекты и достигать высоких показателей производительности. Например, компанией КРОК была реализована задача обеспечения хранения резервных копий на двух площадках, не нагружая при этом дополнительно канал передачи данных, так как основной Fibre Channel канал уже обеспечивает репликацию "продуктивных" данных. Схема решения приведена на рис. 1.

Рис. 1. Конфигурация решения, обеспечивающая хранение резервных копий на двух площадках, не нагружая при этом дополнительно канал передачи данных, так как основной Fibre Channel канал уже обеспечивает репликацию "продуктивных" данных.

Задача была решена в 2 шага:

  1. "насыщение" каждого Data Domain данными с "продуктивных" массивов резервным копированием с локальных массивов;
  2. настройка репликации между Data Domain: так как данные на обеих системах были почти идентичными, то через сеть проходила очень малая доля служебных данных.

Так как между Data Domain будут идти только новые блоки и служебная информация для их репликации, то серьезных требований к пропускной способности канала передачи данных не предъявляется. Кроме того, репликация в Data Domain асинхронная, поэтому задержки в канале также могут быть, т.е. расстояние между системами может быть довольно большим.

Объем реплицируемых данных в конфигурации, представленной на рис. 1, составлял 100 Гбайт, а скорость IP-канала – 100 Мбит/c. Результаты, собранной статистики, показали, что при отправленных логически данных в объеме 119,166 Гбайт, объем реально отправленных данных составлял только 0,872 Гбайт. Загрузка сети реальная и логическая представлена в табл. 1.

Табл. 1. Загрузка сети реальная и логическая
при репликации данных (к рис. 1).
Загрузка сети
реальная
логическая
in, MB/s
out, MB/s
in, MB/s
out, MB/s
0
0
0
0
0,01
0,12
0
2,13
0,06
1,15
0
99,87
0,14
1,81
0
254,61
0,14
1,85
0
257,61
0,15
1,93
0
261,77
0,16
1,93
0
277,12
0,17
2,16
0
307,16
0,19
2,27
0
332,25
0,11
1,3
0
192,89

Дедупликация также очень хорошо себя показала при локальном резервном копировании через Fibre Channel после насыщения системы данными. Cпустя несколько циклов резервного копирования Data Domain уже содержит в себе большую базу с хэш-суммами записанных на него блоков данных, поэтому до записи на диски дело почти не доходит: вся избыточность фильтруется в памяти системы, после чего на повторяющиеся блоки расставляются ссылки.

Пример показателей с реальной системы, которая уже насыщена данными:

  • мгновенная скорость резервного копирования (Мбайт/c): 2239;
  • коэффициент дедупликации: 26,1;
  • загрузка CPU: 49,9%.

Применение BRS для бизнеса среднего сегмента рынка

Средний сегмент рынка характеризуются целым кластером задач резервного копирования. Это, в первую очередь, консистентное копирование большого перечня приложений, активно развивающиеся у заказчиков виртуальные среды, копирование в частных “облаках”.

EMC BRS покрывает практически всю карту потребностей заказчиков. Рассмотрим их на примере наиболее интересных задач решаемых специалистами КРОК.

Резервное копирование виртуальных сред

В настоящее время многие заказчики КРОК уже пользуются преимуществами виртуализации. Например, консолидация серверов при помощи VMware или Hyper-V упрощает выделение ресурсов и сокращает издержки, а также дает массу других преимуществ.

Однако по мере роста данных в виртуальных машинах традиционные средства резервного копирования перестают соответствовать требованиям и мешают дальнейшей виртуализации.

Из средств, предлагаемых EMC BRS для копирования виртуальных сред, мы рекомендуем остановить выбор на EMC Avamar, которое идеально отвечает потребностям заказчиков при резервном копировании виртуальных сред.

Ключевое преимущество Avamar – дедупликация на стороне клиента. Таким образом, во время ежедневного полного резервного копирования передаются только уникальные блоки данных переменной длины. Этот подход существенно (на 95–99%) снижает нагрузку на виртуальную и физическую инфраструктуры по сравнению с традиционным. Avamar дает возможность выполнять резервное копирование как на физических, так и на виртуальных серверах.
Что касается технологии копирования, то оно может осуществляться как на уровне гостевой системы – с использованием агента, так и на уровне образов, например, с использованием vStorage API for Data Protection (VADP) в случае VMware. Причем в последнем случае агент Avamar устанавливается на промежуточную виртуальную машину и забирает на себя процесс резервного копирования со всех продуктивных машин. И таких промежуточных машин может быть множество, т.е. производительность копирования и возможности балансировки нагрузки практически не ограничены.
Также Avamar идеально интегрирован с VMware и позволяет использовать технологию отслеживания измененных блоков (CBT), которая дополнительно ускоряет процесс копирования.

Необходимо заметить, что недавно появившийся в VMware vSphere 5.1 функционал VMware Data Protection (VDP), целиком основан на Avamar.

Что касается вариантов внедрения Avamar, то в зависимости от инфраструктуры заказчика их может быть несколько:

  • Avamar Data Store – аппаратно-программный комплекс, защищенный от выхода из строя узлов (RAIN) и компонент узла (RAID);
  • Avamar Single Node – один узел, идеально подходящий для небольших предприятий или удаленных офисов;
  • Avamar Virtual Edition – программный функционал, реализованный внутри отдельной виртуальной машины, – идеальное решение для небольших виртуальных сред.

Компанией КРОК успешно реализован целый ряд проектов по внедрению резервного копирования виртуальных сред на базе EMC Avamar.

В одном из них задача состояла в резервном копировании фермы из 250 машин. Сделать это нужно было равномерно в течение недели и в минимальные окна резервного копирования. Как видно из графика (рис. 2), в первый день было скопировано 50 машин с объемом данных 3,2 Тбайт, и почти все эти данные были отправлены на Avamar. Операция заняла порядка получаса.

Рис. 2. Процесс резервного копирования фермы из 250 виртуальных машин.

Во второй день к процессу копирования были добавлены следующие 50 машин и еще 3 Тбайт данных "на источнике". За счет дедупликации на Avamar отправлялись только измененные с первого дня копирования данные. Таким образом, во второй день на Avamar добавилось всего 0,3 Тбайт, хотя суммарный объем виртуальных машин составил 6,2 Тбайт. Копирование заняло 42 минуты.

К последнему дню все 250 машин, чей суммарный объем данных составлял порядка 15 Тбайт, находились на Avamar и за счет дедупликации и сжатия занимали всего 3,8 Тбайт. Время копирования не превысило 1,5 часов.

Копирование данных удаленных площадок/офисов

Многие крупные организации имеют широкую филиальную сеть, и копирование распределенных сред – актуальная задача, с которой также справляется Avamar.

Если объем информации на удаленных площадках небольшой или темпы изменений данных невелики, достаточно просто развернуть агенты Avamar на системах, которые нужно копировать в удаленных офисах. За счет эффективной дедупликации по WAN-каналам в централизованное хранилище Avamar направятся только новые субфайловые блоки данных. Из нашего опыта, суммарный объем передаваемой информации с площадки из нескольких серверов (с "продуктивными" базами данных и приложениями) составит несколько десятков гигабайт в день (при изменениях – несколько процентов в день). Этот объем практически не сказывается на загрузке каналов, особенно при правильном подборе времени копирования.

Для удаленных площадок побольше заказчику подойдет немного иная схема – с установкой одноузлового сервера Avamar или Avamar Virtual Edition на виртуальной машине. Резервные копии площадки в этом случае хранятся на этом узле в рамках площадки, что гарантирует прохождение копирования вне зависимости от загруженности или состояния WAN-каналов. А данные, уже находящиеся на этом узле, могут быть отреплицированы средствами Avamar, например, в централизованный ЦОД заказчика, где будут храниться данные со всех площадок. Такая репликация может быть организована и в одном из трех дата-центров КРОК, на базе которых возможно предоставление услуги Disaster Recovery (хранение резервных копий на базе продуктов Avamar).

Реализуя эту задачу, важно обеспечить безопасность при передаче резервных копий по сети. Avamar позволяет настроить шифрование на двух уровнях - на клиенте при передаче данных по каналу (AES-128 и AES-256), так называемое "in-flight", и на устройстве или "at rest" (шифрование всех данных на аппаратных узлах Avamar).

На рис. 3 приведена типовая архитектура одного из проектов КРОК по резервному копированию удаленных офисов, даны ключевые показатели производительности процесса.

Рис. 3. Типовая архитектура одного из проектов КРОК по резервному копированию удаленных офисов.

Копирование всех известных корпоративных приложений и сетевых систем хранения

Продукты EMC способны копировать абсолютно все корпоративные приложения – от "тяжелых" SAP, Oracle и почтовых систем до мобильных платформ. Недавно была реализована и поддержка последних версий Windows Server 2012 и Windows 8, включая неоптимизированное копирование дедуплицированных томов, а также Apple MAC OS версии 10.8.

При этом все продукты ЕМС используют современные интерфейсы интеграции с приложениями (API), и проблем с настройкой копирования данных обычно не возникает.

Хотелось бы отдельно упомянуть про новые возможности массивов Data Domain в части интеграции с приложениями. Обычно с приложением, будь то база данных или почтовая система, интегрируется программный агент централизованного ПО резервного копирования. В случае с ЕМС это тоже так (для агентов Avamar, NetWorker). Однако последние версии Data Domain могут осуществлять прием данных непосредственно от приложения, без использования агентов. Это прекрасно работает с Oracle RMAN, например, администратор баз данных, используя свои скрипты RMAN может легко настроить копирование данных напрямую на массив Data Domain, без привлечения администраторов резервного копирования и другого ПО. Еще одним плюсом этой схемы является работа по протоколу OST и использование функционала BOOST. Это позволяет перенести часть процесса дедупликации с целевого Data Domain на сервер Oracle, что в разы повышает эффективность и скорость копирования. Интересно, что конкуренты ЕМС пока аналогичных решений не предложили.

Говоря о резервном копировании, нельзя не упомянуть задачу копирования сетевых систем хранения данных или так называемых NAS-устройств. Очень многие компании на рынке сегодня используют NAS для хранения ценной информации и общего доступа к ней. Однако из-за непрерывного роста объемов данных становится все сложнее укладываться в разумные временные "окна" копирования: традиционные методы резервного копирования не способны передавать терабайты информации в считанные часы.

Решение – тот же EMC Avamar. Благодаря интегрированной дедупликации, объем данных резервного копирования сокращается еще до передачи информации по сети и записи на диск, даже несмотря на миллионы файлов, которые приходится копировать. В результате, скорость ежедневных полных копирований по существующим каналам значительно возрастает и без выделенной под NDMP сети. Достигается это за счет использования специального узла Avamar Accelerator, который располагается в одном сегменте сети с NAS-хранилищем и выполняет дедупликацию. Схема работы такого узла приведена на рис. 4, где также указаны результаты, полученные КРОК в одном из проектов. Хочется отметить, что для 4 Тбайт данных и 4 миллионов файлов копия создается всего за два-три часа – это практически идеальный результат.

Рис. 4. Решение, в котором благодаря интегрированной дедупликации, объем данных резервного копирования сокращается еще до передачи информации по сети и записи на диск.

Наконец, хотелось бы добавить пару слов об интеграции основных продуктов EMC BRS – Avamar, Data Domain и Networker - между собой. Про последний продукт выше сказано не было, это программное обеспечение резервного копирования Enterprise уровня, которое активно развивается. Взаимосвязь всех компонент между собой можно увидеть на рис. 5.

Рис. 5. Пример интеграции основных продуктов EMC BRS – Avamar, Data Domain и Networker – между собой.

Основным программным продуктом в проектах, связанных с ЕМС BRS, может выступать Networker или Avamar (иногда они используются совместно), а в качестве системы хранения копируемых данных – Data Domain. Однако есть варианты и других интеграций, например, можно передавать данные NetWorker на Avamar, используя дедупликацию последнего.

Мониторинг резервного копирования

Напрашивается вопрос – как же управлять всем этим "зоопарком" из нескольких систем? Для этого можно использовать Data Protection Advisor (DPA) – этот продукт собирает и анализирует информацию со всей инфраструктуры защиты данных, включая виртуальные и физические среды резервного копирования и репликации, чтобы быстро устранять возникающие проблемы и сбои, а также принимать взвешенные решения и проверять, соответствует ли процесс резервного копирования требованиям бизнеса.

Заметим, что DPA интегрируется почти со всеми продуктами других производителей, и поэтому его удобно использовать в том числе и для мониторинга гетерогенных сред.

Помимо этого, у EMC есть средство управления всеми собственными продуктами – EMC Backup and Recovery Manager. Оно позволяет управлять основными компонентами EMC BRS – Networker, Avamar, Data Domain из одного окна.

Резервное копирование в "облака". Проблемы и факты

Тяжелые средства от EMC хороши, но не у всех заказчиков есть средства для единичного вложения. Другим - интересно предложение вкладываться постепенно, в соответствии с тем, сколько данных копируется, а третьим - важно хранить копии данных на вынесенной площадке. Всем трем категориям заказчиков мы предлагаем рассмотреть тему, бурно развивающуюся сейчас как в информационных технологиях в целом, так и в сфере резервного копирования, - Backup-as-a-Service.

Резервное копирование как услуга "под ключ" предполагает, что на системах заказчика будут находиться лишь агенты резервного копирования. Сами данные бэкапа при этом передаются по шифрованному каналу в удаленный ЦОД КРОК, где на базе Avamar построено Disaster Recovery решение.

Кроме того, заказчикам может быть интересен вариант внедрения Avamar Singe Server или Avamar Virtual Edition на собственной площадке и с осуществлением репликации уже дедуплицированных данных в ЦОД КРОК. Варианты размещения агентов в различных ЦОДах продемонстрированы на рис. 6.

Рис. 6. Резервное копирование для SMB в облако "КРОК" на основе Avamar Virtual Edition.

Плюсы схемы Backup-as-a-Service в "облаке" КРОК на базе EMC Avamar:

  • удаленное хранение резервных копий – защита от потери данных вследствие пожаров, затоплений и других чрезвычайных ситуаций;
  • возможность плавного роста и снижение затрат на резервное копирование, вслед за изменением объемов данных и бизнеса, а также отсутствие CapEx затрат на оборудование;
  • минимизация нагрузки на персонал, администрирующий резервное копирование, возможность использования услуги от специалистов техподдержки КРОК “под ключ”;
  • возможность тестирования решения до покупки;
  • существенная экономия на стоимости канала за счет дедупликации на источнике – заказчик платит только за то, что передал;
  • шифрование данных как при передаче (не все это предлагают), так и при хранении;
  • интеграция с “облаком” КРОК;
  • гарантия сохранности данных.

В качестве наглядного примера, приведу пример одного из наших облачных заказчиков.

Для наглядности приведем типовой пример одного из наших облачных заказчиков. Компания разместила несколько машин в "облаке" КРОК, а также копирует несколько машин своей собственной удаленной инфраструктуры:

  • объем данных, скопированных "с источников" (на различных машинах заказчика) в течение месяца – 8110 Гбайт;
  • объем данных, направляемых на Avamar (после дедупликации) – 373 Гбайт;
  • средняя эффективность дедупликации – 96%;
  • стоимость услуги для заказчика в месяц (в соответствии с текущими тарифами) – $440.

Заключение

Подводя итог, хочется отметить, что линейка решений EMC BRS постоянно обновляется, а это значит, что пополняется и копилка технологий резервного копирования, предлагаемых компанией КРОК.

Сергей Верчёнов,
инженер департамента вычислительных систем компании КРОК.

Публикации по теме
Решения по резервному копированию/восстановлению, архивные системы
 
Новости КРОК

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.