Информационное сообщение!
Товар в корзину добавлен. Перейти к оформлению заказа?
Нет
Да
Информационное сообщение!
Ваш заказ успешно создан. На указанный E-mail был отправлен счет для оплаты
Ок

Дата публикации: 3 декабря 2018 г.

* * *

План аварийного восстановления (disaster recovery plan – DRP) это документированный поэтапный план с инструкциями для аварийного восстановления. Этот пошаговый план, состоящий из этапов для решения аварийных инцидентов, который позволяет организации оперативно продолжить работу в информационных системах или быстро восстановить критически важные функции. Перед составлением детального плана, необходимо выполнить расчет следующих основных показателей:

  • анализ воздействия на бизнес (business impact analysis - BIA)
  • анализ рисков (RA)
  • допустимое время восстановления (recovery time objective - RTO)
  • целевую точку восстановления (recovery point objective - RPO)

Роль BIA в планировании аварийного восстановления

В рамках плана аварийного восстановления показатель BIA, определяет затраты (убытки), связанные со сбоями. В отчете BIA дается количественная оценка важности бизнес-компонентов и предлагается соответствующее распределение средств для принятия мер по их защите. Возможности сбоев будут оцениваться с точки зрения их воздействия на безопасность, финансы, маркетинг, деловую репутация, уголовную или административную ответственность перед законом. Где это возможно, воздействие выражается в денежном выражении для целей сравнения. Например, бизнес может потратить в три раза больше средств на маркетинг после катастрофы, чтобы восстановить доверие клиентов и репутацию. BIA должен помогать в создании стратегий восстановления, приоритетов и требований к ресурсам и времени.

Роль RA в планировании аварийного восстановления

Анализ рисков - это процесс выявления и анализа потенциальных проблем, которые могут негативно повлиять на ключевые бизнес-компоненты или критически важные функции, чтобы помочь организациям избежать или смягчить эти риски. Организации используют анализ рисков для:

  • предвосхищения и уменьшения эффекта от вредных результатов неблагоприятных событий
  • планирования решения на отказ или потерю сервиса, или оборудования от неблагоприятных явлений, как природных, так и вызванных человеком
  • оценки, сбалансированы ли потенциальные риски

Роль RTO в планировании аварийного восстановления

Допустимое время восстановления - это максимально допустимый период времени, в течение которого сервис, сеть или информационная система могут быть неработоспособны. RTO является параметром, несоблюдение которого нарушает нормальные операции и количество доходов, потерянных в единицу времени в результате катастрофы. Эти факторы в свою очередь зависят от затронутого оборудования и приложений. RTO измеряется в секундах, минутах, часах или днях и является важным фактором при планировании аварийного восстановления. Многочисленные исследования были проведены в попытке определить стоимость простоя для различных приложений на предприятиях. Эти исследования показывают, что стоимость зависит от долгосрочных и нематериальных эффектов, а также от непосредственных, краткосрочных или ощутимых факторов. Как только RTO для приложения будет определен, технические специалисты могут решить, какие технологии аварийного восстановления лучше всего подходят для этой ситуации. Например, если RTO для информационной системы равно одному часу, то выполнение и хранение резервной копии на внешних жестких дисках будет являться оптимальным решением. Если RTO составляет 2-3 дня, может быть более практичным использование ленточных носителей или внешнего хранилища на удаленном сервере.

Роль RPO в планировании аварийного восстановления

Целевая точка восстановления – это максимальный период времени, за который могут быть потеряны данные из-за сбоя. RPO выражается во времени с момента, когда происходит сбой, и может указываться в секундах, минутах, часах или днях. Это важный параметр при планировании аварийного восстановления (DRP). Как только RPO определен, он определяет минимальную частоту, с которой необходимо делать резервные копии.

Исходя из стратегии восстановления, формируют план реагирования на инцидент, а планы аварийного восстановления описывают, как организация должна действовать. При определении стратегии восстановления организациям следует рассмотреть следующие вопросы:

  • бюджет
  • ресурсы - люди и физические объекты
  • позиция руководства по рискам
  • технологии восстановления
  • данные

Процесс планирования аварийного восстановления включает в себя не просто создание документа, это комплекс действий направленных для борьбы с инцидентом

План аварийного восстановления

Заранее выполненный анализ рисков и анализ влияния на бизнес помогают определить, где сосредоточить ресурсы в процессе планирования аварийного восстановления. BIA идентифицирует воздействие аварийных инцидентов и является отправной точкой для определения риска в контексте аварийного восстановления. Он также генерирует RTO и RPO. RA идентифицирует угрозы и уязвимости, которые могут нарушить работу систем и процессов, выделенных в BIA. Контрольный список DRP включает в себя следующие этапы:

  • установление сферы деятельности
  • сбор документации по инфраструктуре
  • выявление наиболее серьезных угроз, уязвимостей и наиболее важных активов
  • анализ аварийных инцидентов и сбоев, а также порядок их решения
  • определение текущих стратегий аварийного восстановления
  • определение группы реагирования на чрезвычайные ситуации
  • проведение разбора и утверждение плана аварийного восстановления
  • тестирование плана
  • обновление плана
  • внедрение аудита DRP

ПЛАН АВАРИЙНОГО ВОССТАНОВЛЕНИЯ

В плане должны быть определены роли и обязанности всех членов команды ответственных за аварийное восстановление, а так же намечены условия для запуска плана в действие. План должен содержать подробное описание действий по реагированию на инциденты для восстановления. План аварийного восстановления может варьироваться по степени сложности ситуации, от базового до всеобъемлющего. Для создания DRP можно воспользоваться бесплатными ресурсами, например:

https://www.template.net/business/plan-templates/sample-disaster-recovery-plan-examples/
https://www.ibm.com/support/knowledgecenter/ru/ssw_ibm_i_73/rzarm/rzarmdisastr.htm

Контрольный список целей плана аварийного восстановления включает в себя определение критически важных ИТ-сервисов, сетей и т.д., определение приоритетов RTO и определение шагов, необходимых для перезапуска, перенастройки и восстановления систем и сетей. Сотрудники должны знать основные аварийные шаги в случае непредвиденной ситуации.

Рассмотрим несколько конкретных планов аварийного восстановления. DRP могут быть специально адаптированы для определенной среды.

План аварийного восстановления виртуальных систем

Виртуализация предоставляет возможности для ускорения процесса восстановления после сбоев более эффективным и простым способом. Виртуальная среда может создать новые экземпляры виртуальной машины (VM) в течение нескольких минут и обеспечить восстановление приложений с высокой доступностью. Тестирование также может быть легко выполнено, но план должен включать возможность проверки того, что приложения могут быть запущены в режиме аварийного восстановления и возвращены к нормальной работе в RPO и RTO.