Grow-zabbix-node: Обзор базовой конфигурации

Материал из ALT Linux Wiki
Версия от 09:33, 22 октября 2020; Petr-akhlamov (обсуждение | вклад)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)

Обзор базовой конфигурации

В данном разделе рассматривается набор базовых шаблонов, предоставляемых пакетом grow-zabbix-node-altlinux-chainmail-dump-*[1], определяющих параметры наблюдения за узлами с ОС семейства «ALT Linux» и «Кольчуга».

Базовые шаблоны

Шаблоны для пассивного и активного наблюдения

Все шаблоны можно разделить на шаблоны, предназначенные для тех узлов, которые сами сообщают информацию о своём состоянии («активный» агент), и на шаблоны, предназначенные для узлов, наблюдение за состоянием которых осуществляется со стороны сервера, путём периодических опросов («пассивный» агент). Шаблоны, определяющие набор параметров системы одного и того же типа носят схожие имена, но вариант для пассивного наблюдение содержит слово «passive». Исключение составляют базовые шаблоны для активного и пассивного наблюдения Active host и Passive host названия которых явно указывают на тип наблюдения.

Шаблоны, содержащие в своём названии слово «metrics» определяют параметры, для наблюдения за которыми используется агент. Шаблоны, название которых не содержит данное слово, определяют простые проверки, осуществляемые без участия агентов либо же вычисляемые элементы данных.

Шаблоны, определяющие параметры активного наблюдения, как правило, связаны с шаблонами, определяющими формулы для вычисления статуса узла. Такое положение вещей соответствует принятой логике распределённого мониторинга: наблюдаемые узлы и ноды активно передают информацию о своём состоянии и состоянии нижележащей сети наверх, при этом набор собираемых параметров для каждого узла определяется вышестоящей нодой, в то время как набор локально наблюдаемых параметров ноды осуществляется отдельно, на усмотрение локального администратора, и не оказывает влияния на результат распределённого мониторинга.

Шаблоны для вычисления статусных значений

Шаблоны, названия которых содержат слово «status values», определяют вычисляемые элементы данных, используемые в дальнейшем для вычисления общего среднего статуса узла и/или подсети. Вычисление статуса подсети производится по формулам, определяемым в шаблоне «Network status».

Базовые шаблоны узлов

Шаблон «Host» определяет единственный элемент данных — простую проверку ICMP «ping», определяющую доступность узла по сети. Для сообщения о проблеме недоступности узла в шаблоне определён триггер.

Шаблон «Host status values» определяет три вычисляемых параметра, их формулы (значения) по умолчанию:

host.count
количество наблюдаемых узлов, по умолчанию равен 1;
host.status.ping
статус доступности узла (основан на проверке «ping»);
host.status
средний статус узла, по умолчанию также определяется исходя только из доступности узла.

Внимание! Средний статус узла, как правило, переопределяется в каждом из связанных шаблонов. Необходимо помнить, что любое изменение формулы вычисления данного параметра в одном шаблоне, приведёт к затиранию формул во всех связанных шаблонах и узлах, что приведёт к изменению логики распределённого мониторинга, изначально заложенной в данный набор базовых шаблонов.

Шаблоны «Active host» и «Passive host» являются комбинацией базового шаблона узла «Host» и базовых параметров агента сбора данных, определяющих состояние наблюдаемости узла системой мониторинга. В соответствии с принятой логикой распределённого мониторинга, активный вариант наблюдения предусматривает вычисление статусных значений. В рамках данных шаблонов устанавливается отношение между двумя триггерами: индикатор проблем, связанных с агентом сбора данных, ставится в зависимость от индикатора доступности узла, поскольку при недоступности узла, отсутствие позывных от агента в большинстве случаев является следствием первой проблемы.

Шаблоны для наблюдения за агентом и сервером

Шаблоны «Zabbix agent metrics» и «Zabbix agent passive metrics» определяют параметры наблюдения за агентом сбора данных для активного и пассивного режимов соответственно. Элементы данных включают в себя отслеживание позывных агента (agent.ping) и измерение количества процессов zabbix_agentd. Для слежения за изменением этих важных величин в шаблонах определены триггеры.

Шаблон «Zabbix agent status values» определяет формулу вычисления уровня наблюдаемости узла (в процентах). На основании этой величины, вычисленной для каждого из узлов сети, затем вычисляется средняя наблюдаемость сети.

Шаблоны «Zabbix server metrics» и «Zabbix server passive metrics» определяют параметры наблюдения за сервером мониторинга для активного и пассивного режимов соответственно. Элементы данных включают в себя измерение количества процессов сервера мониторинга и СУБД. Для слежения за изменением этих в шаблонах определены триггеры.

Шаблон «Zabbix server status values» определяет формулу вычисления статуса сервера мониторинга. Эта величина используется в дальнейшем для вычисления статуса тех узлов, для которых работающий сервер мониторинга является ключевым компонентом (т.е. для нод).

Наблюдение за базовыми параметрами ОС

Шаблоны «ALT Linux metrics» и «ALT Linux passive metrics» определяют метрики для отслеживания базовых параметров ОС, таких как загрузка центрального процессора и свободное дисковое пространство. Кроме элементов данных, шаблон определяет триггеры, срабатывающие в тех случаях, когда базовая величина пересекает критическую отметку.

Шаблон «ALT Linux status values» определяет формулы для вычисления статуса ЦП, статуса ФС и среднего статуса ОС, получаемого на основании двух предыдущих величин. Величина среднего статуса ОС участвует в вычислении статуса узлов во всех рабочих конфигурациях.

Шаблоны узлов с ОС семейства «ALT Linux»

Рабочие конфигурации для наблюдения за узлами, работающими под управлением ОС семейства «ALT Linux», получаются путём комбинации нескольких шаблонов, определяющих базовые и дополнительные параметры наблюдения и триггеры.

Шаблон «ALT Linux» предназначен для наблюдения за узлом «снаружи», т.е. в активном режиме, избегая входящих подключений к наблюдаемому узлу со стороны сервера. В таком режиме отслеживается большинство узлов, вносящих свой вклад в общий статус сети, поэтому шаблон снабжён формулами для вычисления статусных величин.

Шаблон «ALT Linux passive» является упрощённым эквивалентом предыдущего шаблона, и применяется преимущественно для отслеживания параметров локального узла. По этой причине шаблон не предполагает вычисления статусных величин.

Наблюдение за нодами

Все рабочие конфигурации нод основаны на шаблонах для ОС семейства «ALT Linux» с добавлением параметров наблюдения за сервером мониторинга.

Шаблон «Local node» предназначен для работы локальной ноды. Основная задача локальной ноды — это сбор и обработка данных, получаемых в результате наблюдения за узлами подсети. Для этого шаблон включает в себя формулы для вычисления среднего статуса подсети. Средние величины получаются путём выполнения аггрегирующих вычислений над группой узлов. Наблюдения на параметрами самого локального узла производится лишь для нужд локального администратора, не вносит вклад в распределённый мониторинг (статус локального узла не вычисляется) и в случае необходимости может быть отключено. При наличии вышестоящих нод, параметры работы локальной ноды наблюдаются «снаружи» (агент на локальной ноде в этому случае настраивается для работы как в активном, так и в пассивном режимах) и учитываются при вычислении статуса сети вышестоящего уровня. Узел, настроенный по данному шаблону, может быть зарегистрирован в системе как имеющий адрес '127.0.0.1', хотя это и не обязательно.

Шаблон «Node» предназначен для наблюдения за нодой «снаружи» и используется для узлов, за каждым из которых стоит своя наблюдаемая подсеть. Можно сказать, что шаблон «Local node» — это взгляд на ноду со стороны её локальной сети, а «Node» — это взгляд на ноду со стороны внешней сети. При распределённом мониторинге узлы всех нод, за исключением самой старшей по рангу ноды, регистрируются в системе дважды: один раз как узел той сети, за узлами которой данная нода производит наблюдение, и второй раз как наблюдаемый узел внешней сети. В том случае, если нода является шлюзом, записи о двух соответствующих ей узлах будут иметь различные адреса: один адрес во внутренней сети и второй адрес во внешней сети.

Шаблоны для ОС ИВК «Кольчуга»

Все рабочие конфигурации для узлов с ОС ИВК «Кольчуга» и для узлов с сопутствующим ПО строятся на базе шаблонов, описания которых были даны в предыдущем разделе. Отличие конфигурации узлов с ОС ИВК «Кольчуга» от базовой конфигурации заключается в определении параметров наблюдения за сетевыми службами ОС ИВК «Кольчуга».

Наблюдение за параметрами межсетевого экрана

Шаблоны «Chainmail» и «Chainmail passive» предоставляют рабочие конфигурации для наблюдения за узлами с ОС ИВК «Кольчуга» с использованием активного и пассивного агентов соответственно. Как и в базовых конфигурациях, шаблон для наблюдения «снаружи» (с использованием активного агента) включает в себя вычисление статусных величин.

Параметры наблюдения за сетевыми службами межсетевого экрана ИВК «Кольчуга» определяются в двух базовых шаблонах «Chainmail mertics» и «Chainmail passive metrics» в соответствии с типом наблюдения. В число наблюдаемых параметров входит измерение количества определённых серверных процессов и проверка статуса прослушивания определённых портов. Для отслеживания изменения данных величин определены всего два триггера: один предупреждает о выходе из строя одной или более условно основных служб, а второй — о выходе из строя одной или более условно дополнительных служб.

Отслеживание некоторых параметров (например сервера OpenVPN) по умолчанию отключено, т.к. данные службы не активны в умолчательной конфигурации ИВК «Кольчуга». Если для определённого наблюдаемого узла сети данные службы важны, то необходимо включить отслеживание соответствующего параметра на данном узле, а не в шаблоне, отредактировать или создать новые триггеры.

Наблюдение за центром мониторинга

Центр мониторинга является нодой, построенной на базе ОС ИВК «Кольчуга». Поэтому рабочие конфигурации для центров носят название «Chainmail node» и «Local chainmail node» и предназначены для наблюдения за удалённым центром мониторинга и для работы локального центра мониторинга соответственно.

Наблюдение за параметрами системы интеграции «Юпитер»

Наблюдение за службой системы интеграции «Юпитер» возможно только с помощью активного агента, поскольку данное ПО предназначено для работы за межсетевым экраном. Вывод о работоспособности служб производится на основании результатов проверок статусов прослушивания портов с номерами 5736 … 5741.

  1. Где * обозначает тип БД.