КРОК: резервное копирование на практике
30, апрель 2013 Обзор особенностей решений EMC BRS (Backup & Recovery Systems – системы резервного копирования/восстановления), а также ряда их внедрений, осуществленных компанией КРОК.
Введение Резервное копирование (РК) критически важных данных – одна из ключевых задач для всех сегментов рынка без исключения – от SMB до Enterprise. Компания КРОК достаточно давно и успешно строит решения по защите данных и созданию резервных копий на базе аппаратных и программных продуктов EMC. Данная статья – об этих решениях и примерах их внедрения. Резервное копирование бизнес-критичных приложений в ЦОДах На сегодняшний день организация резервного копирования в крупных ЦОДах – задача довольна простая. Однако с другой стороны, для ее решения требуется соблюдение целого ряда условий, среди которых:
Для задачи сохранения места в стойках и повышения эффективности используемого пространства – решения EMC подходят как нельзя лучше. За счет интеллектуальной дедупликации блоками переменной длины аппаратные комплексы EMC, например, Data Domain, позволяют высвободить столь ценное в ЦОДе место, используемое под резервные копии. В сравнении с библиотеками класса high-end экономия стоечного места в unit'ах может доходить до десятков раз. Что касается остальных обозначенных выше задач, то все их с успехом реализует флагман модельного ряда EMC – система Data Domain 990 (DD990), имеющая скорость записи по FC/VTL – 15 Тбайт/ч, а по 10GigE/BOOST – 31 Тбайт/ч. С этими показателями EMC Data Domain занимает первое место по производительности среди одноконтроллерных систем хранения резервных копий. Производительность и масштабируемость системы рассчитаны на крупные предприятия, перед которыми стоит задача консолидации операций резервного копирования в единой системе. Основными технические характеристики систем EMC Data Domain 990:
В настоящее время анонсирована и новая версия DD OS (Data Domain Operating System) – 5.3, которая позволит расширить и без того достаточно объемный список опций. Среди них:
Заметим, что вся линейка DD от EMC имеет прозрачную масштабируемость, благодаря чему пользователи могут как модернизировать модели контроллеров Data Domain, так и наращивать емкость внутри модели путем добавления полок. Все эти уникальные возможности помогают осуществлять интересные проекты и достигать высоких показателей производительности. Например, компанией КРОК была реализована задача обеспечения хранения резервных копий на двух площадках, не нагружая при этом дополнительно канал передачи данных, так как основной Fibre Channel канал уже обеспечивает репликацию "продуктивных" данных. Схема решения приведена на рис. 1.
Задача была решена в 2 шага:
Так как между Data Domain будут идти только новые блоки и служебная информация для их репликации, то серьезных требований к пропускной способности канала передачи данных не предъявляется. Кроме того, репликация в Data Domain асинхронная, поэтому задержки в канале также могут быть, т.е. расстояние между системами может быть довольно большим. Объем реплицируемых данных в конфигурации, представленной на рис. 1, составлял 100 Гбайт, а скорость IP-канала – 100 Мбит/c. Результаты, собранной статистики, показали, что при отправленных логически данных в объеме 119,166 Гбайт, объем реально отправленных данных составлял только 0,872 Гбайт. Загрузка сети реальная и логическая представлена в табл. 1.
Дедупликация также очень хорошо себя показала при локальном резервном копировании через Fibre Channel после насыщения системы данными. Cпустя несколько циклов резервного копирования Data Domain уже содержит в себе большую базу с хэш-суммами записанных на него блоков данных, поэтому до записи на диски дело почти не доходит: вся избыточность фильтруется в памяти системы, после чего на повторяющиеся блоки расставляются ссылки. Пример показателей с реальной системы, которая уже насыщена данными:
Применение BRS для бизнеса среднего сегмента рынка Средний сегмент рынка характеризуются целым кластером задач резервного копирования. Это, в первую очередь, консистентное копирование большого перечня приложений, активно развивающиеся у заказчиков виртуальные среды, копирование в частных “облаках”. EMC BRS покрывает практически всю карту потребностей заказчиков. Рассмотрим их на примере наиболее интересных задач решаемых специалистами КРОК. Резервное копирование виртуальных сред В настоящее время многие заказчики КРОК уже пользуются преимуществами виртуализации. Например, консолидация серверов при помощи VMware или Hyper-V упрощает выделение ресурсов и сокращает издержки, а также дает массу других преимуществ. Однако по мере роста данных в виртуальных машинах традиционные средства резервного копирования перестают соответствовать требованиям и мешают дальнейшей виртуализации. Из средств, предлагаемых EMC BRS для копирования виртуальных сред, мы рекомендуем остановить выбор на EMC Avamar, которое идеально отвечает потребностям заказчиков при резервном копировании виртуальных сред. Ключевое преимущество Avamar – дедупликация на стороне клиента. Таким образом, во время ежедневного полного резервного копирования передаются только уникальные блоки данных переменной длины. Этот подход существенно (на 95–99%) снижает нагрузку на виртуальную и физическую инфраструктуры по сравнению с традиционным. Avamar дает возможность выполнять резервное копирование как на физических, так и на виртуальных серверах. Необходимо заметить, что недавно появившийся в VMware vSphere 5.1 функционал VMware Data Protection (VDP), целиком основан на Avamar. Что касается вариантов внедрения Avamar, то в зависимости от инфраструктуры заказчика их может быть несколько:
Компанией КРОК успешно реализован целый ряд проектов по внедрению резервного копирования виртуальных сред на базе EMC Avamar. В одном из них задача состояла в резервном копировании фермы из 250 машин. Сделать это нужно было равномерно в течение недели и в минимальные окна резервного копирования. Как видно из графика (рис. 2), в первый день было скопировано 50 машин с объемом данных 3,2 Тбайт, и почти все эти данные были отправлены на Avamar. Операция заняла порядка получаса.
Во второй день к процессу копирования были добавлены следующие 50 машин и еще 3 Тбайт данных "на источнике". За счет дедупликации на Avamar отправлялись только измененные с первого дня копирования данные. Таким образом, во второй день на Avamar добавилось всего 0,3 Тбайт, хотя суммарный объем виртуальных машин составил 6,2 Тбайт. Копирование заняло 42 минуты. К последнему дню все 250 машин, чей суммарный объем данных составлял порядка 15 Тбайт, находились на Avamar и за счет дедупликации и сжатия занимали всего 3,8 Тбайт. Время копирования не превысило 1,5 часов. Копирование данных удаленных площадок/офисов Многие крупные организации имеют широкую филиальную сеть, и копирование распределенных сред – актуальная задача, с которой также справляется Avamar. Если объем информации на удаленных площадках небольшой или темпы изменений данных невелики, достаточно просто развернуть агенты Avamar на системах, которые нужно копировать в удаленных офисах. За счет эффективной дедупликации по WAN-каналам в централизованное хранилище Avamar направятся только новые субфайловые блоки данных. Из нашего опыта, суммарный объем передаваемой информации с площадки из нескольких серверов (с "продуктивными" базами данных и приложениями) составит несколько десятков гигабайт в день (при изменениях – несколько процентов в день). Этот объем практически не сказывается на загрузке каналов, особенно при правильном подборе времени копирования. Для удаленных площадок побольше заказчику подойдет немного иная схема – с установкой одноузлового сервера Avamar или Avamar Virtual Edition на виртуальной машине. Резервные копии площадки в этом случае хранятся на этом узле в рамках площадки, что гарантирует прохождение копирования вне зависимости от загруженности или состояния WAN-каналов. А данные, уже находящиеся на этом узле, могут быть отреплицированы средствами Avamar, например, в централизованный ЦОД заказчика, где будут храниться данные со всех площадок. Такая репликация может быть организована и в одном из трех дата-центров КРОК, на базе которых возможно предоставление услуги Disaster Recovery (хранение резервных копий на базе продуктов Avamar). Реализуя эту задачу, важно обеспечить безопасность при передаче резервных копий по сети. Avamar позволяет настроить шифрование на двух уровнях - на клиенте при передаче данных по каналу (AES-128 и AES-256), так называемое "in-flight", и на устройстве или "at rest" (шифрование всех данных на аппаратных узлах Avamar). На рис. 3 приведена типовая архитектура одного из проектов КРОК по резервному копированию удаленных офисов, даны ключевые показатели производительности процесса.
Копирование всех известных корпоративных приложений и сетевых систем хранения Продукты EMC способны копировать абсолютно все корпоративные приложения – от "тяжелых" SAP, Oracle и почтовых систем до мобильных платформ. Недавно была реализована и поддержка последних версий Windows Server 2012 и Windows 8, включая неоптимизированное копирование дедуплицированных томов, а также Apple MAC OS версии 10.8. При этом все продукты ЕМС используют современные интерфейсы интеграции с приложениями (API), и проблем с настройкой копирования данных обычно не возникает. Хотелось бы отдельно упомянуть про новые возможности массивов Data Domain в части интеграции с приложениями. Обычно с приложением, будь то база данных или почтовая система, интегрируется программный агент централизованного ПО резервного копирования. В случае с ЕМС это тоже так (для агентов Avamar, NetWorker). Однако последние версии Data Domain могут осуществлять прием данных непосредственно от приложения, без использования агентов. Это прекрасно работает с Oracle RMAN, например, администратор баз данных, используя свои скрипты RMAN может легко настроить копирование данных напрямую на массив Data Domain, без привлечения администраторов резервного копирования и другого ПО. Еще одним плюсом этой схемы является работа по протоколу OST и использование функционала BOOST. Это позволяет перенести часть процесса дедупликации с целевого Data Domain на сервер Oracle, что в разы повышает эффективность и скорость копирования. Интересно, что конкуренты ЕМС пока аналогичных решений не предложили. Говоря о резервном копировании, нельзя не упомянуть задачу копирования сетевых систем хранения данных или так называемых NAS-устройств. Очень многие компании на рынке сегодня используют NAS для хранения ценной информации и общего доступа к ней. Однако из-за непрерывного роста объемов данных становится все сложнее укладываться в разумные временные "окна" копирования: традиционные методы резервного копирования не способны передавать терабайты информации в считанные часы. Решение – тот же EMC Avamar. Благодаря интегрированной дедупликации, объем данных резервного копирования сокращается еще до передачи информации по сети и записи на диск, даже несмотря на миллионы файлов, которые приходится копировать. В результате, скорость ежедневных полных копирований по существующим каналам значительно возрастает и без выделенной под NDMP сети. Достигается это за счет использования специального узла Avamar Accelerator, который располагается в одном сегменте сети с NAS-хранилищем и выполняет дедупликацию. Схема работы такого узла приведена на рис. 4, где также указаны результаты, полученные КРОК в одном из проектов. Хочется отметить, что для 4 Тбайт данных и 4 миллионов файлов копия создается всего за два-три часа – это практически идеальный результат.
Наконец, хотелось бы добавить пару слов об интеграции основных продуктов EMC BRS – Avamar, Data Domain и Networker - между собой. Про последний продукт выше сказано не было, это программное обеспечение резервного копирования Enterprise уровня, которое активно развивается. Взаимосвязь всех компонент между собой можно увидеть на рис. 5.
Основным программным продуктом в проектах, связанных с ЕМС BRS, может выступать Networker или Avamar (иногда они используются совместно), а в качестве системы хранения копируемых данных – Data Domain. Однако есть варианты и других интеграций, например, можно передавать данные NetWorker на Avamar, используя дедупликацию последнего. Мониторинг резервного копирования Напрашивается вопрос – как же управлять всем этим "зоопарком" из нескольких систем? Для этого можно использовать Data Protection Advisor (DPA) – этот продукт собирает и анализирует информацию со всей инфраструктуры защиты данных, включая виртуальные и физические среды резервного копирования и репликации, чтобы быстро устранять возникающие проблемы и сбои, а также принимать взвешенные решения и проверять, соответствует ли процесс резервного копирования требованиям бизнеса. Заметим, что DPA интегрируется почти со всеми продуктами других производителей, и поэтому его удобно использовать в том числе и для мониторинга гетерогенных сред. Помимо этого, у EMC есть средство управления всеми собственными продуктами – EMC Backup and Recovery Manager. Оно позволяет управлять основными компонентами EMC BRS – Networker, Avamar, Data Domain из одного окна. Резервное копирование в "облака". Проблемы и факты Тяжелые средства от EMC хороши, но не у всех заказчиков есть средства для единичного вложения. Другим - интересно предложение вкладываться постепенно, в соответствии с тем, сколько данных копируется, а третьим - важно хранить копии данных на вынесенной площадке. Всем трем категориям заказчиков мы предлагаем рассмотреть тему, бурно развивающуюся сейчас как в информационных технологиях в целом, так и в сфере резервного копирования, - Backup-as-a-Service. Резервное копирование как услуга "под ключ" предполагает, что на системах заказчика будут находиться лишь агенты резервного копирования. Сами данные бэкапа при этом передаются по шифрованному каналу в удаленный ЦОД КРОК, где на базе Avamar построено Disaster Recovery решение. Кроме того, заказчикам может быть интересен вариант внедрения Avamar Singe Server или Avamar Virtual Edition на собственной площадке и с осуществлением репликации уже дедуплицированных данных в ЦОД КРОК. Варианты размещения агентов в различных ЦОДах продемонстрированы на рис. 6.
Плюсы схемы Backup-as-a-Service в "облаке" КРОК на базе EMC Avamar:
В качестве наглядного примера, приведу пример одного из наших облачных заказчиков. Для наглядности приведем типовой пример одного из наших облачных заказчиков. Компания разместила несколько машин в "облаке" КРОК, а также копирует несколько машин своей собственной удаленной инфраструктуры:
Заключение Подводя итог, хочется отметить, что линейка решений EMC BRS постоянно обновляется, а это значит, что пополняется и копилка технологий резервного копирования, предлагаемых компанией КРОК. Сергей Верчёнов, |
|