Содержимое
Пост на злобу дня: Аэрофлот упал, но быстро поднялся. В других отраслях тоже проблемы — то ли из-за атак, то ли по другим причинам. Это всё, с одной стороны, про безопасность, а с другой — про непрерывность бизнеса. Обычно это считают подразделом безопасности — требования иметь планы BCP и DRP описаны в стандарте ISO 27001, в основном в виде сохранения защиты данных при авариях/чрезвычайных происшествий. BCP — Business Continuity Plan: как мы собираемся работать, несмотря ни на что (атаки, аварии, стихийные бедствия, другие форс-мажоры). DRP — Disaster Recovery Plan: как мы собираемся восстанавливаться после аварии. Это очень клёвые документы, особенно если они разработаны по-честному, а не для галочки/чтобы пройти аудит. Это как аптечка в походе — обычно не нужна, но если нужна, то очень. Близки к этому понятия RTO — Recovery Time Objective, целевое время восстановления, и RPO — Recovery Point Objective, целевая точка восстановления (а к какому, собственно, состоянию мы восстанавливаемся, что мы готовы потерять? далеко не факт, что ответ "ничего не готовы"). Я вам честно скажу — не знаю, как это в крупных компаниях организовано. Вроде интернет говорит, что есть какие-то отдельные BCM — Business Continuity Managers, менеджеры по непрерывности бизнеса. Не знаю, не видел. В проектах, где я в разработке таких планов участвовал, всегда была рабочая группа из представителей бизнеса (операционного подразделения, клиентского, рисков), безопасности, ИТ и с обязательными участием бизнес- и системных аналитиков. Потому что бизнес выдает требования и оценивает последствия рисков, ИТ предлагает решения, а прокапыванием и проектированием деталей занимается аналитик. Ну а кто кроме БА знает, что в процессе может пойти не так и как его можно выполнить альтернативно? Какие процессы наиболее критичны? Какая последовательность восстановления? Какие системы наиболее критичны для работы? Есть документ, который даже в названии содержит слово "анализ": BIA — Business Impact Analysis. Это вообще кайфовый документ для людей, склонных к упорядочиванию всего: вот у нас есть такой риск, что случится, если он реализуется? Что кто будет делать? Что кто не сможет сделать? Какие процессы остановятся/замедлятся? К чему это приведет? Что мы потеряем в деньгах и репутации, чем навредим людям, партнерам и обществу? Упражнение в чем-то напоминает то, что дает Сергей Нужненко: Какие входы у вас есть? Какие выходы? Какие ресурсы? Как это всё управляется? Что будет, если потоки на них прервутся/замедлятся? Люди не смогут войти в здание, оборвется электричество, заболеют ключевые сотрудники, будут уничтожены данные / виртуальные сервера, прекратится доступ к Интернету или отдельным сервисам? В конце концов, у армии США есть даже план по отражению угрозы нашествия зомби (CONPLAN 8888), а чем мы хуже? В отличие от анализа рисков BIA (а также BCP и DRP) подразумевает ещё и необходимые ресурсы. Например, в одной организации мне гордо показывали серверную с собственным охлаждением, резервным питанием и выводом для подключения внешнего генератора. На мой вопрос, а заключен ли договор с поставщиками таких генераторов, ну или хотя бы есть ли их список под рукой, люди только удивленно хлопали глазами. Конечно, когда через год возник локальный пожар в щитке и серверная осталась без электричества, никакой внешний генератор быстро не приехал. А в другой компании наоборот — не говоря о резервировании ИТ, был даже заключен договор на целый резервный офис с подготовленным оборудованием и периодически проводились учения по его развертыванию.