Типичное распределение трафика на веб-сервере

Вы уже знаете, как применить собранную статистику для задач, нуждающихся в немедленном решении. Но возможно, вам стоит взглянуть на свой сайт в более глобальной перспективе, как в буквальном смысле (по мере того как сайт завоевывает международную популярность), так и в переносном (при анализе проблем, связанных со стратегией продукта и сайта).

Как упоминалось ранее, хорошее знание пиков и провалов в использовании различных ресурсов играет исключительно важную роль для прогнозирования будущего. По мере накопления все большего объема исторических данных в них могут проявляться менее очевидные закономерности, которые могут стать основой для принятия долгосрочных решений.

Для примера взгляните на рисунок, на нем представлен график изменения интенсивности трафика на веб-сервере за день.

Рисунок весьма типичен для дневного распределения трафика в США. Нагрузка начинает медленно расти утром (по Восточному времени), когда пользователи начинают работать в Интернете. Затем пользователи уходят на обед, а в сети появляются пользователи с Западного побережья. Нагрузка какое-то время держится на высоком уровне, а затем начинает падать, когда пользователи уходят с работы. В конечном итоге остаются только пользователи, работающие в Интернете по ночам.

С наращиванием нагрузки можно ожидать, что график будет стремиться вверх, так как в те же самые периодические пики и провалы ваш сайт посещает большее количество пользователей. Но если аудитория приобретает интернациональный характер, ежедневный пик расширяется с количеством часовых поясов активных пользователей. Как видно из рисунке ниже, если сайт завоюет популярность в удаленных регионах, на графике может исчезнуть даже четко различимое падение нагрузки после ухода американских пользователей.

Распределение трафика расширяется с ростом количества пользователей из других стран

На рисунке представлены два распределения трафика за день, разделенные интервалом в год и наложенные друг на друга. То, что раньше было плавно поднимающимся выступом с последующим падением, из-за международной популярности превратилось в выступ с двумя вершинами.

Скорее всего, специалисты из отделов управления продуктом и маркетинга отлично представляют себе демографическое и географическое распределение аудитории, но привязка этих данных к ресурсам системы может помочь в прогнозировании потребностей в мощностях.

Рисунок также показывает, что веб-серверы должны выдерживать пиковый трафик в течение более длительных периодов. По этим данным также можно определить, на какие периоды следует планировать перерывы на техобслуживание, чтобы свести минимуму эффект неработоспособности или снижения качества обслуживания. Обратите внимание на изменившееся соотношение между периодами пиковой и минимальной нагрузки. От него зависит, потеря скольких серверов вследствие сбоев может произойти без нарушения работоспособности сайта, то есть фактически потолок вашего кластера.

Следите за изменениями в распределении трафика вашего приложения. Это нужно не только для контроля текущей деятельности, но и для обоснования принимаемых решений по планированию мощностей (скажем, о необходимости развертывания новых мощностей в вычислительных центрах, находящихся в других странах).