<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>ono &#187; Применение мониторинга</title>
	<atom:link href="/category/planirovanie-moshhnostej/primenenie-monitoringa/feed" rel="self" type="application/rss+xml" />
	<link>http://ono.org.ua</link>
	<description>жизнь в цифровом мире</description>
	<lastBuildDate>Wed, 07 Aug 2013 08:59:17 +0000</lastBuildDate>
	<language>ru-RU</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=4.2.8</generator>
	<item>
		<title>Нагрузочное тестирование на одном компьютере</title>
		<link>http://ono.org.ua/nagruzochnoe-testirovanie-na-odnom-kompyutere.html</link>
		<comments>http://ono.org.ua/nagruzochnoe-testirovanie-na-odnom-kompyutere.html#comments</comments>
		<pubDate>Wed, 07 Mar 2012 10:03:51 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Применение мониторинга]]></category>

		<guid isPermaLink="false">http://ono.org.ua/?p=1659</guid>
		<description><![CDATA[
Если вам доступна такая роскошь, как использование распределителя нагрузки для добавления и исключения серверов из пула, задача определения потолков мощностей решается относительно просто. Но если в вашем распоряжении всего один компьютер, она заметно усложняется. Как увеличить нагрузку на  [...]]]></description>
				<content:encoded><![CDATA[<p><a href="/wp-content/uploads/2012/03/testirovanie.png"><img class="aligncenter size-full wp-image-1661" title="Нагрузочное тестирование" src="/wp-content/uploads/2012/03/testirovanie.png" alt="Нагрузочное тестирование" width="519" height="317" /></a></p>
<p>Если вам доступна такая роскошь, как использование распределителя нагрузки для добавления и исключения серверов из пула, задача определения потолков мощностей решается относительно просто. Но если в вашем распоряжении всего один компьютер, она заметно усложняется. Как увеличить нагрузку на отдельном компьютере?<span id="more-1659"></span></p>
<p>Конечно, вы не сможете обзвонить пользователей и попросить их быстрее щелкать кнопкой мыши, однако повышение нагрузки на сервер можно реализовать посредством повторного воспроизведения запросов. Существует много инструментов такого рода, из которых особенно положительное впечатление оставили два:</p>
<ul>
<li>Httperf (http://www.hpl.hp.com/research/linux/httperf/)</li>
<li>Siege (http://www.joedog.org/JoeDog/Siege)</li>
</ul>
<p>Оба инструмента позволяют взять файл, заполненный URL-адресами HTTP, и перебирать их с разной скоростью для обработки запросов сервером. Это дает возможность увеличивать нагрузку очень медленно и осторожно, что крайне важно в средах с одним компьютером — нагрузочное тестирование не должно парализовать ваш единственный работоспособный сервер. Безопасность метода оставляет желать лучшего, и его следует применять только для незначительного приращения нагрузки в надежных условиях — например, во время периода пониженного трафика.</p>
<p>Искусственное тестирование нагрузки, пусть даже посредством воспроизведения реальных запросов, имеет целый ряд ограничений. Несмотря на возможность контроля за интенсивностью запросов и самими запросами, они все равно не дают точного представления о поведении сервера в критической ситуации.</p>
<p>Например, в зависимости от того, как вашему приложению разрешено изменять данные, с имитацией реальной нагрузки по журналу предыдущих запросов могут возникнуть проблемы. Возможно, перезапись уже записанных данных окажется нежелательной и вам придется вносить изменения в воспроизводимые журналы.</p>
<p>Другое ограничение точное представление отношений «клиент- сервер» присуще всем сценариям нагрузочного тестирования веб-ресурсов. При использовании Httperf или Siege вы сможете имитировать запросы от нескольких клиентов, но в действительности все запросы будут поступать от одного клиентского сервера, на котором выполняется сценарий. Одно из возможных решений основано на запуске сценариев на нескольких машинах. Программа Autobench (http://www.xenoclast.org/autobench/), написанная на Perl обертка для Httperf, обеспечивает возможность скоординированного выполнения сценария на нескольких хостах. Autobench также может собирать сводные результаты.</p>
<p>Но даже результаты Autobench отличны от результатов реальных запросов. Клиенты могут быть разбросаны но всей планете; они могут обладать сильно различающимися сетевыми задержками, скоростями подключения и множеством других переменных факторов.</p>
<p>С повышением интенсивности запросов с одной клиентской машины тоже необходима осторожность. Клиентские ресурсы могут кончиться раньше серверных, что приведет к искажению результатов. Будьте внимательны, чтобы во время этих искусственных тестов не были нарушены ограничения по количеству клиентских файловых дескрипторов, пропускной способности каналов и загрузки процессоров.</p>
<p>Вместо того чтобы тратить время на обход ограничений искусственного тестирования, рассмотрите возможность такого обновления вашей архитектуры, которое упростило бы определение серверных потолков. Распределитель нагрузки, пусть даже всего с одним дополнительным сервером, не только поможет вам выявить ограничения, но и повысит <a title="Архитектурные решения" href="/arxitekturnye-resheniya.html">устойчивость архитектуры</a> в целом.</p>
<p>График сгенерирован на основе данных RRD для одного из вебсерверов Flickr в периоды ежедневных пиков и падений, отсортированных по возрастанию загрузки процессора. Он подтверждает, что загрузка процессора действительно прямо пропорциональна количеству активных процессов Apache, по крайней мере в диапазоне от 40 до 90 процентов загрузки процессора.</p>
<p>Из этого можно сделать вывод, что использование в Flickr загрузки процессора как единственной <a title="Разные виды требований и метрик" href="/raznye-vidy-trebovanij-i-metrik.html">определяющей метрики</a> мощности веб-серверов достаточно безопасно. Кроме того, эта метрика напрямую связана с объемом работы, выполняемой веб-сервером, и, можно надеяться, еще и с трафиком сайта. Взяв эту информацию за основу, мы в настоящее время установили верхний предел общей загрузки процессора, равный 85 процентам; это дает нам достаточный резерв для того, чтобы справиться со случайными выбросами, но при этом обеспечить эффективное использование серверов.</p>
<p>Дополнительный анализ показывает, что коэффициент между загрузкой процессора и активными процессами Apache составляет около 1,1, что позволяет легко рассчитать одну метрику по известному значению другой. В общем случае нахождение простой связи между статистикой использования системных ресурсов и работой, выполняемой на прикладном уровне, сильно пригодится при переходе к прогнозированию.</p>
]]></content:encoded>
			<wfw:commentRss>http://ono.org.ua/nagruzochnoe-testirovanie-na-odnom-kompyutere.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Определение потолков веб-сервера в среде с балансировкой нагрузки</title>
		<link>http://ono.org.ua/opredelenie-potolkov-veb-servera-v-srede-s-balansirovkoj-nagruzki.html</link>
		<comments>http://ono.org.ua/opredelenie-potolkov-veb-servera-v-srede-s-balansirovkoj-nagruzki.html#comments</comments>
		<pubDate>Fri, 03 Feb 2012 18:12:41 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Применение мониторинга]]></category>

		<guid isPermaLink="false">http://ono.org.ua/?p=1636</guid>
		<description><![CDATA[
Сбор данных о потолках ресурсов веб-сервера может быть упрощен по крайней мере одним архитектурным решением, которое вы, вероятно, уже приняли: использованием балансировщика нагрузки. 
Чтобы убедиться в том, что ваши оценки потолков выдерживают проверку «живым» трафиком, осторожно увеличивайте  [...]]]></description>
				<content:encoded><![CDATA[<p><a href="/wp-content/uploads/2012/02/cpu_usage_apache_hits.jpg"><img class="aligncenter size-full wp-image-1637" title="Зависимость общей загрузки процессора от количества активных процессов Apache  " src="/wp-content/uploads/2012/02/cpu_usage_apache_hits.jpg" alt="Зависимость общей загрузки процессора от количества активных процессов Apache  " width="600" height="387" /></a></p>
<p>Сбор данных о потолках ресурсов веб-сервера может быть упрощен по крайней мере одним архитектурным решением, которое вы, вероятно, уже приняли: использованием <a title="Балансировка нагрузки" href="/balansirovka-nagruzki.html">балансировщика нагрузки</a>. <span id="more-1636"></span></p>
<p>Чтобы убедиться в том, что ваши оценки потолков выдерживают проверку «живым» трафиком, осторожно увеличивайте рабочую нагрузку на некоторых веб-серверах и измеряйте ее влияние на ресурсы. Нагрузка увеличивается выводом машин из пула серверов, что при водит к соответствующему увеличению нагрузки на оставшихся серверах. Мне хотелось бы подчеркнуть важность использования реального трафика, в отличие от запуска имитации или попытки моделирования ресурсов веб-сервера в искусственной среде.</p>
<p>Упражнение с распределением нагрузки подтверждает предположение, сделанное в предыдущем разделе, а именно отношение между загрузкой процессора и количеством активных процессов Apache остается (приблизительно) постоянным. На рисунке показано возрастание количества активных процессов Apache и соответствующей загрузки процессора.</p>
]]></content:encoded>
			<wfw:commentRss>http://ono.org.ua/opredelenie-potolkov-veb-servera-v-srede-s-balansirovkoj-nagruzki.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Измерение нагрузки на веб-серверах</title>
		<link>http://ono.org.ua/izmerenie-nagruzki-na-veb-serverax.html</link>
		<comments>http://ono.org.ua/izmerenie-nagruzki-na-veb-serverax.html#comments</comments>
		<pubDate>Fri, 03 Feb 2012 17:33:40 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Применение мониторинга]]></category>

		<guid isPermaLink="false">http://ono.org.ua/?p=1631</guid>
		<description><![CDATA[Концепция мощности веб-сервера привязана к конкретному приложению. В общем случае веб-сервер рассматривается как front-end машина которая принимает запросы пользователей, обращается к back-end-pесурсам (например, базам данных), а затем на основании результатов этих обращений генерирует ответы. Одни  [...]]]></description>
				<content:encoded><![CDATA[<p>Концепция мощности веб-сервера привязана к конкретному приложению. В общем случае веб-сервер рассматривается как front-end машина которая принимает запросы пользователей, обращается к back-end-pесурсам (например, базам данных), а затем на основании результатов этих обращений генерирует ответы. Одни приложения обращаются к базам данных с простыми, быстрыми запросами, другие с меньшим количеством более сложных запросов. Одни сайты предоставляют в основном статические страницы, другие генерируют главным образом динамический контент. На основании <a title="Сбор данных прикладного уровня" href="/sbor-dannyx-prikladnogo-urovnya.html">метрик прикладного уровня</a>, как впрочем и системного, формируется обобщенное представление об использовании веб-сервера, которое служит основой для планирования мощностей.<span id="more-1631"></span></p>
<p><a title="Цели и проблемы планирования мощностей" href="/celi-i-problemy-planirovaniya-moshhnostej.html">Планирование мощностей</a> для веб-серверов (статических и динамических) ориентируется на пиковые нагрузки, а следовательно, имеет нежесткий характер в отличие от <a title="Скорость потребления дискового пространства" href="/skorost-potrebleniya-diskovogo-prostranstva.html">потребления дискового пространства</a>. Серверы ежедневно потребляют широкий спектр аппаратных ресурсов, а их «предел прочности» находится где-то в районе полного поглощения этих ресурсов. Ваша задача заключается в выявлении периодических пиков и использовании их для управления траекторией планирования мощностей. Как и для любого ресурса с пиковыми нагрузками, вы должны определить, когда возникают такие пики, а затем проанализировать причины их циклического возникновения.</p>
<p><strong>Реальный пример: сбор метрических данных для веб-сервера</strong></p>
<p>В качестве примера рассмотрим метрики отдельного веб-сервера на базе Apache, собираемые с разной периодичностью (час, день, неделя). На рисунке представлены графики для всех трех частот сбора данных, на основе которых мы попытаемся определить периодичность пиковых нагрузок.</p>
<p><a href="/wp-content/uploads/2012/02/apache_hits.jpg"><img class="aligncenter size-full wp-image-1632" title="Распределение количества запросов Apache по часам, дням и неделям" src="/wp-content/uploads/2012/02/apache_hits.jpg" alt="Распределение количества запросов Apache по часам, дням и неделям" width="600" height="701" /></a></p>
<p>На почасовом графике никакие закономерности не наблюдаются, тогда как на ежедневном графике видно плавное снижение и подъем. В контексте планирования мощностей наибольший интерес представляет еженедельный график, на котором видно, что по понедельникам веб-сервер обрабатывает наибольший трафик. Как говорится, «это то самое место, начинаем копать».</p>
<p>Для начала следует сузить состав анализируемых аппаратных ресурсов. Чтобы сократить список, мы будем игнорировать ресурсы, работающие в рамках своих возможностей во время пиковых нагрузок. Использование памяти, <a title="Закономерности дискового ввода/вывода" href="/zakonomernosti-diskovogo-vvodavyvoda.html">дисковые операции ввода/вывода</a> и <a title="Сбор данных и планирование сетевых ресурсов" href="/sbor-dannyx-i-planirovanie-setevyx-resursov.html">сетевые ресурсы</a> (не рассматриваемые сейчас) даже близко не подходят к своим ограничениям во время пиковых нагрузок. Исключив эти ресурсы из списка потенциальных «узких мест», мы получим достаточно важную информацию о мощности нашего веб-сервера. Остается процессорное время, которое, как можно предположить, и является критическим ресурсом. На рисунке показаны два графика загрузки процессора.</p>
<p><a href="/wp-content/uploads/2012/02/cpu_usage.jpg"><img class="aligncenter size-full wp-image-1633" title="Системная и пользовательская загрузка процессора на веб-сервере: представление по дням" src="/wp-content/uploads/2012/02/cpu_usage.jpg" alt="Системная и пользовательская загрузка процессора на веб-сервере: представление по дням" width="600" height="551" /></a></p>
<p>Из рисунка видно, что на пике (с объединением пользовательской и системной загрузки) процессор загружен лишь немногим более чем на 50%. Давайте сравним эти данные с фактической работой, выполняемой веб-сервером, и посмотрим, приводит ли загрузка процессора к видимым последствиям на прикладном уровне. На рисунке ниже, представлено количество активных процессов Apache для анализируемого нами времени.</p>
<p><a href="/wp-content/uploads/2012/02/apache_procs_busy.jpg"><img class="aligncenter size-full wp-image-1634" title="Занятые процессы Apache: представление по дням" src="/wp-content/uploads/2012/02/apache_procs_busy.jpg" alt="Занятые процессы Apache: представление по дням" width="600" height="329" /></a></p>
<p>Графики, приведенные выше, подтверждают то, что и так очевидно, — количество активных процессов Apache пропорционально загрузке процессора. Согласно самым свежим данным RRD, на 50,7 процентах загрузки процессора (45,20 пользовательская + 5,50 системная) задействовано 46 процессов Apache.</p>
<p>Если предположить, что связь между загрузкой процессора и количеством активных процессов Apache остается неизменной (то есть прямо пропорциональной), до того момента, когда загрузка процессора достигнет какого-то высокого (и вероятно, небезопасного) уровня, не встретившегося на наших графиках, можно вполне обоснованно считать, что мощность процессора в нашей системе достаточна.</p>
]]></content:encoded>
			<wfw:commentRss>http://ono.org.ua/izmerenie-nagruzki-na-veb-serverax.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Журналы и резервные копии: проблема метамощностей</title>
		<link>http://ono.org.ua/zhurnaly-i-rezervnye-kopii-problema-metamoshhnostej.html</link>
		<comments>http://ono.org.ua/zhurnaly-i-rezervnye-kopii-problema-metamoshhnostej.html#comments</comments>
		<pubDate>Fri, 03 Feb 2012 17:08:44 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Применение мониторинга]]></category>

		<guid isPermaLink="false">http://ono.org.ua/?p=1628</guid>
		<description><![CDATA[
Журналы и резервные копии данных занимают весьма значительный объем дискового пространства, и выработка требований к ним порой оказывается непростым делом. И журналы, и резервные копии являются частью любых осмысленных процедур планирования непрерывности бизнеса (ВСР) и аварийного восстановления  [...]]]></description>
				<content:encoded><![CDATA[<p><a href="/wp-content/uploads/2012/02/Time_backup.jpg"><img class="aligncenter size-full wp-image-1629" title="Журналы и резервные копии" src="/wp-content/uploads/2012/02/Time_backup.jpg" alt="Журналы и резервные копии" width="500" height="320" /></a></p>
<p>Журналы и резервные копии данных занимают весьма значительный объем дискового пространства, и выработка требований к ним порой оказывается непростым делом. И журналы, и резервные копии являются частью любых осмысленных процедур планирования непрерывности бизнеса (ВСР) и <a title="Аварийное восстановление" href="/avarijnoe-vosstanovlenie.html">аварийного восстановления</a> (DR), поэтому требования к ним следует учитывать наряду с <a title="Требования к мощностям в сфере «бизнес-бизнес»" href="/trebovaniya-k-moshhnostyam-v-sfere-biznes-biznes.html">базовыми бизнес-требованиями</a>. План резервного копирования необходим всегда, но как долго следует хранить резервные копии? Неделю? Месяц? Вечно? Ответ на эти вопросы зависит от сайта, приложения и области деятельности.<span id="more-1628"></span></p>
<p>Например для финансовой информации могут существовать юридические обязательства по <a title="Хранение данных" href="/xranenie-dannyx.html">хранению данных</a> в течение определенного периода времени, сформулированное в федеральных законах. С другой стороны, некоторые сайты, особенно поисковые системы хранят некоторые виды данных (например, историю поиска) относительно недолго, чтобы обеспечить конфиденциальность пользователя.</p>
<p>Политика хранения журналов и резервных копий зависит и от того, какая часть данных должна оставаться в оперативном доступе (определяется в политике сохранения/удаления данных), а какая часть может быть перенесена на более дешевое (и обычно более медленное) архивное оборудование. В планировании такого типа хранения данных нет ничего особенного, но о нем часто забывают, так как критические гарантии работоспособности сайтов обычно не зависят от журналов и резервных копий. О том, как посредством сбора данных выявить растущие потребности в дисковом пространстве и процесс прогнозирования этих потребностей будет рассказано далее.</p>
]]></content:encoded>
			<wfw:commentRss>http://ono.org.ua/zhurnaly-i-rezervnye-kopii-problema-metamoshhnostej.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Закономерности дискового ввода/вывода</title>
		<link>http://ono.org.ua/zakonomernosti-diskovogo-vvodavyvoda.html</link>
		<comments>http://ono.org.ua/zakonomernosti-diskovogo-vvodavyvoda.html#comments</comments>
		<pubDate>Fri, 03 Feb 2012 16:52:36 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Применение мониторинга]]></category>

		<guid isPermaLink="false">http://ono.org.ua/?p=1625</guid>
		<description><![CDATA[
Следующий по важности фактор &#8212; механизм обращения к данным на диске. Ваш сайт поставляет пользователям видеоролики, требующие значительного объема последовательного доступа к диску? Или в дисковой подсистеме хранится база данных, в которой ищутся разрозненные фрагменты данных, непредсказуемым  [...]]]></description>
				<content:encoded><![CDATA[<p><a href="/wp-content/uploads/2012/02/disk_server.jpg"><img class="aligncenter size-full wp-image-1626" title="Дисковые накопители на сервере" src="/wp-content/uploads/2012/02/disk_server.jpg" alt="Дисковые накопители на сервере" width="500" height="332" /></a></p>
<p>Следующий по важности фактор &#8212; механизм обращения к данным на диске. Ваш сайт поставляет пользователям видеоролики, требующие значительного объема последовательного доступа к диску? Или в дисковой подсистеме хранится база данных, в которой ищутся разрозненные фрагменты данных, непредсказуемым образом распределенные по разным дискам?<span id="more-1625"></span></p>
<p>Выбор метрик использования дискового пространства зависит от архитектуры хранения данных, для которой вы пытаетесь собрать информацию, но в основной набор входят следующие метрики:</p>
<ul>
<li>объем читаемых данных;</li>
<li>объем записываемых данных;</li>
<li>продолжительность ожидания процессором завершения чтения или записи.</li>
</ul>
<p>Дисковые накопители — самые медленные устройства на сервере. В зависимости от характеристик нагрузки на сервер их метрики могут определять мощности всей серверной платформы. Существует несколько способов измерения нагрузки и пропускной способности дисков. Многие полезные инструменты сбора данных об использовании дисковых устройств вы найдете далее.</p>
<p>Независимо от того, используется ли RAID-массив в локальной подсистеме, сетевое устройство NAS (Network-Attached Storage) или какая-либо технология кластерного хранения данных, основные метрики остаются неизменными: <a title="Скорость потребления дискового пространства" href="/skorost-potrebleniya-diskovogo-prostranstva.html">потребление дискового пространства</a> и потребление ресурсов дискового ввода/вывода. Потребление доступного дискового пространства и интенсивность обращения к нему не зависят от выбора аппаратного решения, но в любом случае отслеживать необходимо и то и другое.</p>
]]></content:encoded>
			<wfw:commentRss>http://ono.org.ua/zakonomernosti-diskovogo-vvodavyvoda.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Скорость потребления дискового пространства</title>
		<link>http://ono.org.ua/skorost-potrebleniya-diskovogo-prostranstva.html</link>
		<comments>http://ono.org.ua/skorost-potrebleniya-diskovogo-prostranstva.html#comments</comments>
		<pubDate>Fri, 03 Feb 2012 16:43:44 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Применение мониторинга]]></category>

		<guid isPermaLink="false">http://ono.org.ua/?p=1622</guid>
		<description><![CDATA[При планировании потребностей приложения в хранении данных первым и важнейшим фактором должна быть скорость потребления дискового пространства, то есть рост объема данных за конкретный отрезок времени. Учет интенсивности потребления дискового пространства может сыграть ключевую роль в работе  [...]]]></description>
				<content:encoded><![CDATA[<p>При планировании потребностей приложения в хранении данных первым и важнейшим фактором должна быть скорость потребления дискового пространства, то есть рост объема данных за конкретный отрезок времени. Учет интенсивности потребления дискового пространства может сыграть ключевую роль в работе сайтов, связанных с потреблением, обработкой и хранением мультимедийных файлов (графики, видео- и аудиоданных). Однако за скоростью потребления дискового пространства важно следить даже при незначительном росте сайта.<span id="more-1622"></span></p>
<p>Вероятно, дисковое пространство — самая понятная из всех метрик мощностей. Даже технически некомпетентный пользователь компьютера понимает, что будет, если на диске кончится свободное место.</p>
<p>Что же касается скорости потребления дискового пространства, главный вопрос формулируется так:</p>
<ul>
<li>Когда на диске кончится свободное пространство?</li>
</ul>
<p><strong>Реальный пример: отслеживание скорости потребления дискового пространства</strong></p>
<p>На сайте Flickr для отправки и хранения фотографий расходуется огромный объем дискового пространства. Я использую этот простой случай как пример планирования скорости потребления.</p>
<p>Фотографии, отправленные пользователями, делятся на группы в зависимости от их размера и передаются в подсистему хранения. Компания собирает разнообразные метрики, относящиеся к этому процессу, в том числе:</p>
<ul>
<li>продолжительность обработки каждого изображения при преобразовании его в различные варианты размера;</li>
<li>количество отправленных фотографий;</li>
<li>средний размер фотографий;</li>
<li>объем дискового пространства, занимаемого фотографиями.</li>
</ul>
<p>Позднее вы увидите, почему были выбраны именно эти метрики, а пока нас интересует последний пункт: общее <a title="Хранение данных" href="/xranenie-dannyx.html">потребление дискового пространства</a> по времени.</p>
<p>Сбор и сохранение данных происходит ежедневно. Этот промежуток времени обеспечивает достаточную детализацию для отображения закономерностей за неделю, месяц, квартал и праздничный сезон.</p>
<p>Следовательно, данные могут использоваться для прогнозирования того, когда возникнет необходимость в <a title="Приобретение оборудования" href="/priobretenie-oborudovaniya.html">закупке нового оборудования</a>. В таблице представлены данные о потреблении дискового пространства (только для фотографий) за двухнедельный период в 2005 году.</p>
<p>Таблица. Пример статистики ежедневного потребления дискового пространства</p>
<table border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td valign="top" width="112">
<p align="center">Дата</p>
</td>
<td valign="top" width="306">
<p align="center">Общее потребление, Гбайт</p>
</td>
<td valign="top" width="371">
<p align="center">Ежедневное потребление, Гбайт</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">26/07/05</p>
</td>
<td valign="top" width="306">
<p align="center">14321,83</p>
</td>
<td valign="top" width="371">
<p align="center">138,00</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">27/07/05</p>
</td>
<td valign="top" width="306">
<p align="center">14452,60</p>
</td>
<td valign="top" width="371">
<p align="center">130,77</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">28/07/05</p>
</td>
<td valign="top" width="306">
<p align="center">14586,54</p>
</td>
<td valign="top" width="371">
<p align="center">133,93</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">29/07/05</p>
</td>
<td valign="top" width="306">
<p align="center">14700,89</p>
</td>
<td valign="top" width="371">
<p align="center">114,35</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">30/07/05</p>
</td>
<td valign="top" width="306">
<p align="center">14845,72</p>
</td>
<td valign="top" width="371">
<p align="center">144,82</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">31/07/05</p>
</td>
<td valign="top" width="306">
<p align="center">15063,99</p>
</td>
<td valign="top" width="371">
<p align="center">218,27</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">01/08/05</p>
</td>
<td valign="top" width="306">
<p align="center">15250,21</p>
</td>
<td valign="top" width="371">
<p align="center">186,21</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">02/08/05</p>
</td>
<td valign="top" width="306">
<p align="center">15403,82</p>
</td>
<td valign="top" width="371">
<p align="center">153,61</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">03/08/05</p>
</td>
<td valign="top" width="306">
<p align="center">15558,81</p>
</td>
<td valign="top" width="371">
<p align="center">154,99</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">04/08/05</p>
</td>
<td valign="top" width="306">
<p align="center">15702,35</p>
</td>
<td valign="top" width="371">
<p align="center">143,53</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">05/08/05</p>
</td>
<td valign="top" width="306">
<p align="center">15835,76</p>
</td>
<td valign="top" width="371">
<p align="center">133,41</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">06/08/05</p>
</td>
<td valign="top" width="306">
<p align="center">15986,55</p>
</td>
<td valign="top" width="371">
<p align="center">150,79</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">07/08/05</p>
</td>
<td valign="top" width="306">
<p align="center">16189,27</p>
</td>
<td valign="top" width="371">
<p align="center">202,72</p>
</td>
</tr>
<tr>
<td valign="top" width="112">
<p align="center">08/08/05</p>
</td>
<td valign="top" width="306">
<p align="center">16367,88</p>
</td>
<td valign="top" width="371">
<p align="center">178,60</p>
</td>
</tr>
</tbody>
</table>
<p>Данные в таблице были получены при помощи задания cron, запускающего сценарий для сохранения вывода стандартной команды Unix df. Затем данный объединяются и выводятся в управляющем приложении. (Flickr также собирает информацию с намного большей детализацией [минуты] с использованием Ganglia, но для текущего примера &#8212; этo несущественно.)</p>
<p><a href="/wp-content/uploads/2012/02/disk_usage.jpg"><img class="aligncenter size-full wp-image-1623" title="Ежедневное потребление дискового пространства" src="/wp-content/uploads/2012/02/disk_usage.jpg" alt="Ежедневное потребление дискового пространства" width="600" height="378" /></a></p>
<p>При отображении данных из таблицы на диаграмме ясно видны два обстоятельства. Из рисунка сразу видно, что 31/7 и 07/08 пользователи отправляли много фотографий. Стоит учесть, что 31 июля и 7 августа 2005 года — это воскресенья. И действительно, данные, собранные за продолжительный период, показывают, что по воскресеньям всегда наблюдается пик отправки фотографий. На диаграмме также проявляется другая общая закономерность: пятница — день недели с минимальным объемом потребления дискового пространства. Тенденции будут рассматриваться далее, а пока достаточно знать, что для их проявления данные должны собираться с соответствующей детализацией. На некоторых сайтах колебания метрик отображаются по часам (например, ленты новостей или информация о погоде), другие сайты используют месячные сводки (повышенный объем продаж перед Рождеством на сайтах розничной торговли).</p>
]]></content:encoded>
			<wfw:commentRss>http://ono.org.ua/skorost-potrebleniya-diskovogo-prostranstva.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Хранение данных</title>
		<link>http://ono.org.ua/xranenie-dannyx.html</link>
		<comments>http://ono.org.ua/xranenie-dannyx.html#comments</comments>
		<pubDate>Fri, 03 Feb 2012 12:52:07 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Применение мониторинга]]></category>

		<guid isPermaLink="false">http://ono.org.ua/?p=1618</guid>
		<description><![CDATA[
Тема устройств хранения информации весьма обширна. В контексте нашей темы мы ограничимся аспектами, непосредственно влияющими на планирование мощностей для сайтов с большими объемами данных.
Одна из самых подходящих аналогий для устройств хранения данных — стакан воды. Эта аналогия сочетает  [...]]]></description>
				<content:encoded><![CDATA[<p><a href="/wp-content/uploads/2012/02/data_storage.jpg"><img class="aligncenter size-full wp-image-1619" title="Хранение данных" src="/wp-content/uploads/2012/02/data_storage.jpg" alt="Хранение данных" width="500" height="303" /></a></p>
<p>Тема устройств хранения информации весьма обширна. В контексте нашей темы мы ограничимся аспектами, непосредственно влияющими на планирование мощностей для сайтов с большими объемами данных.<span id="more-1618"></span></p>
<p>Одна из самых подходящих аналогий для устройств хранения данных — стакан воды. Эта аналогия сочетает постоянные ограничения (размер стакана) с переменными (количество воды, которую можно налить или вылить из стакана в любой момент времени). Она помогает представить два основных фактора, которые необходимо учитывать при решении вопроса о том, где и как хранить данные:</p>
<ul>
<li>максимальную емкость носителя информации;</li>
<li>скорость обращения к данным.</li>
</ul>
<p>Традиционно в задачах управления веб-ресурсами основное внимание уделяли первому фактору &#8212; размеру стакана. Тем не менее многие крупные фирмы-поставщики оборудования формировали свои <a title="Аппаратные решения" href="/apparatnye-resheniya.html">линейки продуктов</a> с учетом обоих соображений. Чаще всего предлагается два варианта: большие, медленные и дешевые диски (обычно с интерфейсом ATA/SATA) и меньшие по размеру, быстрые и дорогие (технологии SCSI и SAS).</p>
<p>Несмотря на то, что хранение данных является достаточно развитой областью, в ней до сих пор появляется много новых (и возможно, революционных) технологий, о которых тоже необходимо знать. Твердотельные (solid-state) накопители и иерархические схемы хранения информации, в которых они используются, вскоре могут стать нормой — стоимость хранения данных продолжает падать, а физическая скорость ввода/вывода при работе с ними за последние годы остается неизменной.</p>
]]></content:encoded>
			<wfw:commentRss>http://ono.org.ua/xranenie-dannyx.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Сбор данных прикладного уровня</title>
		<link>http://ono.org.ua/sbor-dannyx-prikladnogo-urovnya.html</link>
		<comments>http://ono.org.ua/sbor-dannyx-prikladnogo-urovnya.html#comments</comments>
		<pubDate>Fri, 03 Feb 2012 12:42:56 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[Применение мониторинга]]></category>

		<guid isPermaLink="false">http://ono.org.ua/?p=1615</guid>
		<description><![CDATA[
Как упоминалось ранее, серверная статистика — только часть общей картины. Следует собирать и сохранять статистику более высокого уровня, специфическую для вашего приложения, связанную не с общим сервером, а с системой в целом. Загрузка процессора и использование дисков на веб-сервере не даст  [...]]]></description>
				<content:encoded><![CDATA[<p><a href="/wp-content/uploads/2012/02/sbor_dannyh.jpg"><img class="aligncenter size-full wp-image-1616" title="метрики прикладного уровня" src="/wp-content/uploads/2012/02/sbor_dannyh.jpg" alt="метрики прикладного уровня" width="500" height="288" /></a></p>
<p>Как упоминалось ранее, серверная статистика — только часть общей картины. Следует собирать и сохранять статистику более высокого уровня, специфическую для вашего приложения, связанную не с общим сервером, а с системой в целом. Загрузка процессора и использование дисков на веб-сервере не даст полной информации о том, что происходит с каждым веб-запросом, а в обработке потока веб запросов может быть задействовано несколько устройств.<span id="more-1615"></span></p>
<p>В Flickr используется управляющее приложение, которое собирает все эти метрики прикладного уровня. Данные собираются как на повседневной, так и на накопительной основе. Некоторые метрики (скажем, количество переданных фотографий) можно получить из базы данных. Другие вычисляются посредством обработки серверной статистики, например, <a title="Сбор данных и планирование сетевых ресурсов" href="/sbor-dannyx-i-planirovanie-setevyx-resursov.html">наличие сетевых ресурсов</a> или суммарные затраты дискового пространства на многих компьютерах.</p>
<p>Для сбора данных могут использоваться даже такие простые методы, как запуск сценария из задания cron и сохранение результатов в собственной базе данных для последующей обработки.</p>
<p>Некоторые метрики, которые отслеживаются в Flickr.</p>
<ul>
<li>Переданные фотографии (ежедневная, накопительная )</li>
<li>Переданные фотографии в час.</li>
<li>Средний размер фотографии (ежедневная, накопительная )</li>
<li>Время, потраченное на разделение фотографий по размерам (ежечасная).</li>
<li>Регистрации пользователей (ежедневная, накопительная).</li>
<li>Подписка на учетные записи «Pro» (ежедневная, накопительная).</li>
<li>Количество фотографий, помеченных тегами (ежедневная, накопительная).</li>
<li>Трафик API (количество используемых ключей API, количество запросов в секунду на один ключ).</li>
<li>Количество уникальных тегов (ежедневная, накопительная).</li>
<li>Количество фотографий с географической привязкой (ежедневная, накопительная).</li>
</ul>
<p>Кроме того, фиксируются и некоторые финансовые метрики, например, количество принятых платежей. В процессе работы над конкретным приложением будет полезно выделить время на связывание финансовых и бизнес-данных с отслеживаемыми прикладными и системными метриками.</p>
<p>Вычисление полной стоимости владения (ТСО, Total Cost of Ownership) будет неполным без информации о том, с какими затратами для бизнеса связаны эти системные и прикладные метрики,</p>
<p>Представьте, что вы можете рассчитать реальные затраты на предоставление одной веб-страницы в вашем приложении. Наличие таких результатов не только выводит <a title="Архитектурные решения" href="/arxitekturnye-resheniya.html">архитектуру</a> на совершенно иной уровень (бизнес-метрики вместо доступности или метрик производительности), но и формирует контекст для высшего руководства, ориентированного на финансовые показатели, слабо разбирающегося в технической стороне дела.</p>
<p>Важность идентификации и отслеживания прикладных метрик невозможно переоценить. Ваши усилия будут вознаграждены: контекст системной статистики расширяется за пределы параметров исправности сервера, что поможет в <a title="Прогнозирование сбоев систем" href="/prognozirovanie-sboev-sistem.html">формировании прогнозов</a>. Как будет показано далее, вычисления ТСО также оказывают бесценную помощь в процессе приобретения мощностей.</p>
<p>Итак, мы рассмотрели основные принципы <a title="Как измеряются мощности" href="/kak-izmeryayutsya-moshhnosti.html">сбора данных о мощностях</a>. Теперь давайте разберемся, на какие метрики вам — администратору сайта с потенциальной возможностью быстрого роста — стоит обратить особое внимание. Я опишу стандартные элементы веб инфраструктуры и приведу список рекомендаций по измерению мощностей и оценке их ограничений Чтобы обсуждение было более конкретным, пояснения будут делаться на примерах из практики планирования мощностей Flickr. Примеры всего лишь демонстрируют некоторые полезные метрики, которые могут пригодиться и в вашей работе. Они вовсе не означают, что архитектура или реализация Flickr подойдет для каждого приложения.</p>
]]></content:encoded>
			<wfw:commentRss>http://ono.org.ua/sbor-dannyx-prikladnogo-urovnya.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
