
Измерение и совершенствование MTTR в вашей инженерной команде: от хаоса к предсказуемости
Существует момент, которого боится каждый инженер — оповещение в 3 часа ночи, когда происходит сбой в чём-то критически важном, и внезапно ваша команда переходит в режим тушения пожара. Настоящий вопрос заключается не в том, произойдёт ли сбой системы (он произойдёт), а в том, насколько быстро вы сможете восстановить её работу. Именно здесь на помощь приходит среднее время восстановления (MTTR), и, честно говоря, это один из самых недооценённых показателей в инженерии. Не потому, что он сложный, а потому, что большинство команд измеряют его неправильно или, что ещё хуже, не измеряют вовсе....