TGINSIGHT POST
Post #1207
@leadgr
Teamlead Good Reads – ежедневные советы про менеджмент людей и команд
Содержимое
SRE принципы для CI/CD пайплайна Хороший подход к определению ожиданий к стабильности CI/CD пайплайна с использованием хорошо известных SRE практик: ⭐️Service Level Objectives (SLOs): какой уровень стабильности гарантирован. 📊Service Level Indicators (SLIs): как именно трекается уровень стабильности. 🧳Error Budgets: как долго пайплайн может не отвечать требованиям SLO. Пример: ⭐️SLO: Каждый коммит должен быть протестирован в течение 5 минут после пуша. 📊SLI: Общее время прогона билда. 🧳Error budget: 40 билдов, время прогона которых заняло больше 5 минут, на протяжении 4 недель. Мне особенно зашла идея с определением бюджетов на ошибку. Таким образом, команде, отвечающей за инфраструктуру, не придется бросать все свои задачи и реагировать на любое отклонение от желаемых значений. Но если проблемы накапливаюся, есть четко определенный момент принятия решения о том, что делать дальше.