Содержимое
Жизнь подкидывает иллюстрации к идеям с учебы. Я на тренинге рассказываю про оценку уровня риска для определения нефункциональных требований: ☹️недовольство пользователей, 🤬критические репутационные потери, 💵некритичная потеря денег, 💲критичная для существования бизнеса потеря денег, ☠️потеря жизни и здоровья человека / многих людей. Сюда же можно добавить отзыв лицензии / приостановку деятельности. И вот — пожар на складе временного хранения "Чердак". Очень сочувствую людям, потерявшим свои вещи — дорогие памятью или стоимостью. Сам был дважды в таком положении: с одного склада мои вещи просто выбросили ("забудь"), а отцовскую квартиру его квартиранты разграбили, выбросив на помойку семейные документы XIX века и архив работ моего прадеда-художника. Так что очень хорошо понимаю всю скорбь. А с точки зрения рисков — ну, вряд ли компания дальше продолжит своё существование, да и весь рынок временного хранения под вопросом. Впрочем, альтернатив особо нет. Риск, конечно, не связан с программным обеспечением, но если системно посмотреть — явно не учтен. На тренинге по информационной безопасности, например, пожарную безопасность тоже учитывают (а нам даже рассказывали про атаку проникновения, когда после поджога вместе с пожарными в офис вошли злоумышленники и утащили несколько корзин с дисками из серверной, уж не знаю, правда или нет). Однако, таких ситуаций, чтобы сбой ПО привел к краху компании, не очень много. Видимо, наши системы всё же не настолько критичны :) Потеря денег — да, катастрофы — ну, может быть, да и те в основном из-за человеческого фактора, но вот чтобы из-за этого организация прекратила своё существование? Я помню только один случай: Knight Capital Group, американская финансовая компания, специализирующаяся на высокочастотной торговле. Причем в пик своего расцвета она одна генерировала 17% объема торгов на Нью-Йоркской бирже и NASDAQ. Но в 1 августа 2012 года на один из восьми торговых серверов забыли раскатить новую версию их программы. А в ней было важное обновление: пересмотрен формат данных. И флаг, которым раньше помечалась выполненная заявка на сделку, был заменен на другой. Старое ПО новый флаг не воспринимало, не считало заявку выполненной, поэтому генерировало их в бесконечном цикле. За 45 минут оно успело выставить 4 миллиона заявок, накупило акций на 7 миллиардов и расфигачило фондовый рынок (цены на некоторые мелкие акции поехали в разные стороны на 70 и более процентов). На продаже ошибочно купленных акций компания потеряла 440 млн. долларов. Впрочем, даже такие деньги были в пределах требований регулятора по объему собственного капитала, так что формально компания могла существовать дальше. Они даже нашли финансирование на покрытие этих расходов. Но доверие было подорвано, акции самой компании критически упали, и через год её продали конкурентам. Вот такие последствия ручного развертывания релизов, неаккуратной политики версионирования форматов сообщений и отсутствия мониторинга бизнес-операций. Кажется, была ещё какая-то крипто-биржа, объявившая себя банкротом из-за бага и атаки, направленной на этот баг. По-моему, они там умудрились куда-то деть 850 тыс. биткоинов. Обратите внимание — в обоих случаях речь идёт о софте, который напрямую манипулирует деньгами, причем в больших объемах. Другие известные сбои, такие как коллапс системы сортировки багажа в аэропорте Хитроу или потеря космических аппаратов из-за программных ошибок — обычно не приводят к закрытию организаций, максимум — кого-нибудь увольняют. Поэтому, наверное, все программные системы до сих пор ещё не обвешены мониторингами со всех сторон и не проходят формальной верификации перед запуском — просто риски низкие.