SLA (Соглашение об уровне обслуживания)

Итак, что же такое «соглашение об уровне обслуживания» (SLA)? Это инструмент, который позволяет бизнесменам чувствовать себя более уверенно — нечто вроде страхового полиса. А в более широком смысле SLA — это метрика, определяющая характеристики работы службы в согласованных границах. Метрика часто подкрепляется финансовыми стимулами — графиком выплаты премий за достижение целей или штрафами за их невыполнение. Для сайтов SLA наиболее важны уровни доступности и производительности.

Некоторые SLA гарантируют, что сервис будет доступен определенный процент времени, например 99,99%. Это означает, что 0,01 % от общего времени сервис может быть недоступен и при этом все равно останется в границах SLA. Другие SLA требуют, чтобы интенсивность использования сервиса оставалась в разумных пределах. В этом случае типичными параметрами будут ограничения частоты запросов, используемого дискового пространства и объема передаваемых данных.

Компания, занимающаяся веб-хостингом, может включить в свой документ с условиями обслуживания абзац следующего вида:

Acme Hosting, Inc. приложит коммерчески оправданные усилия к тому, чтобы план SuperHostingPlan оставался доступным с ежемесячным процентом работоспособного времени (см. ниже) не менее 99 9% в пределах каждого месячного цикла оплаты. В том спучае, если Acme Hosting, Inc. не выполнит это обязательство, другая сторона получает право на бесплатное обслуживание в течение следующего времени:

Процент работоспособного времени за месяц

Продолжительность бесплатного обслуживания

От 99 до 99 9°/о 1 день
Менее 99% 1 недепя

Выглядит внушительно, не правда ли? К сожалению, в масштабах месяца оказывается не такой уж большой величиной, как можно подумать:

30 дней = 720 часов = 43 200 минут
99 9% от 43 200 минут = 43 156,8 минуты
43 200 минут — 43 156,8 минуты = 43,2 минуты

Выходит, что каждый месяц сервис может быть недоступен 43.2 минуты без штрафов. Если на вашем сайте ежеминутно совершаются покупки на $3000, вы можете легко рассчитать, в какую сумму обойдется вам любой простой (не учитывая недовольство клиентов, которое измерить сложнее). В таблице приведена продолжительность времени простоя для разных процентов работоспособного времени за год.

Таблица. Проценты SLA и допустимые простои

Допустимый процент работоспособности по SLA

Время простоя за год

90,0% 36 дней 12 часов
95,0% 18 дней  6 часов
99,9% 87 часов 36 минут
99,50% 43 часа 48 минут
99 90% 8 часов 45 минут 36 секунд
99,99% 52 минуты 33 секунды
99,999% 5 минут 15 секунд
99,9999% 32 секунды

Термин «пять девяток» часто используется при обсуждении SLA и доступности. Он означает доступность 99,999% и встречается в маркетинговой литературе не реже, чем в технической. Считается, что сайт или система с уровнем доступности «пять девяток» обладает высокой доступностью.

Показатели доступности SLA определяют уровень доверия к сервису веб-сайта, но они также подразумевают, что простой непосредственно преобразуются в недополученную прибыль. На мой взгляд, простая математика здесь не совсем корректна. Если ваш сервис, приносящий $3000 прибыли в минуту, недоступен в течение 10 минут, предполагается, что вы потеряли $30 000. На самом же деле клиенты могут продолжить работу позднее и купить всё, что они собирались купить в момент сбоя. Кроме того, ваш бизнес может вкладывать дополнительные средства в службу поддержки клиентов, чтобы сбои не отражались на ваших заработках.

Суть в том, что точные, однозначные финансовые эквиваленты простоев могут оказаться ни точными, ни однозначными, однако важность доступности сервиса сомнений не вызывает.