Us control: различия между версиями

Материал из WiKi - UserSide
Строка 40: Строка 40:


== Логика работы ==
== Логика работы ==
* Каждый запуск модуль проверяет состояние SNMP-параметров у контролируемых устройств. Если значение параметра выходит за пределы допустимого, то считается, что произошла тревога. Тревожных параметров на устройстве может быть несколько. По каждому устройству, где был найден тревожный параметр или наоборот - параметр пришёл в норму - формируется электронное письмо и/или SMS для выбранного ''(на уровне каждого устройства)'' круга получателей
* По каждому устройству формируется отдельное письмо/сообщение, в котором будут все параметры, состояние ''(тревога/норма)'' которых изменилось. В письме информация будет представлена развёрнуто, в SMS - компактно
* Следующее сообщение будет прислано только в случае, если изменился вновь какой-то параметр


* Если в процессе опроса будет выяснено, что опрашиваемое устройство неактивно ''(в процессе подключения к устройству произошла ошибка, либо возникла ошибка при съёме параметра)'', то это будет отмечено модулем и в следующие несколько циклов запуска ''(по-умолчанию: 5)'' это устройство опрашиваться не будет, чтобы не создавать задержек в опросе прочих параметров.
* Если в процессе опроса будет выяснено, что опрашиваемое устройство неактивно ''(в процессе подключения к устройству произошла ошибка, либо возникла ошибка при съёме параметра)'', то это будет отмечено модулем и в следующие несколько циклов запуска ''(по-умолчанию: 5)'' это устройство опрашиваться не будет, чтобы не создавать задержек в опросе прочих параметров.

Версия от 21:19, 3 декабря 2014

Эта функция является одной из возможностью
обновления даты активности у объекта

US_CONTROL - это модуль для постоянного контроля средствами SNMP настраиваемых показателей у устройств и оповещения сотрудников и подразделений о фактах выхода значений этих показателей за пределы установленных значений.

Общие данные

Язык модуля: Perl

Текущая версия: см. на странице: Модули

Статус модуля: Платный

Необходимые модули Perl:

DBI
Time::Local
threads
Net::SNMP
FindBin

Общую информацию для всех модулей см. на странице: Модули

Настройка модуля осуществляется в файле us_config.tmp

Параметры

$zuserver - адрес сервера с UserSide
$zuuser - имя пользователя для доступа к базе UserSide
$zupass - пароль для доступа к базе UserSide
$zubase - имя базы данных UserSide
$ps_logpath - путь к логам модуля
$zsilence - не выводить уведомления о работе модуля в консоль
$zlost_count - не опрашивать неактивные устройства N-циклов запуска (в случае определения их неактивности). По-умолчанию: 5

Запуск модуля

Опрос параметров выполняется в многопоточном режиме. По 500 параметров на поток. Модуль требуется прописать в системный cron с частотой запуска - ежеминутно. Если контролируемых параметров очень много, то разумным является менее частый запуск.

* * * * * perl us_control.pl &> /dev/null

Логика работы

  • Каждый запуск модуль проверяет состояние SNMP-параметров у контролируемых устройств. Если значение параметра выходит за пределы допустимого, то считается, что произошла тревога. Тревожных параметров на устройстве может быть несколько. По каждому устройству, где был найден тревожный параметр или наоборот - параметр пришёл в норму - формируется электронное письмо и/или SMS для выбранного (на уровне каждого устройства) круга получателей
  • По каждому устройству формируется отдельное письмо/сообщение, в котором будут все параметры, состояние (тревога/норма) которых изменилось. В письме информация будет представлена развёрнуто, в SMS - компактно
  • Следующее сообщение будет прислано только в случае, если изменился вновь какой-то параметр
  • Если в процессе опроса будет выяснено, что опрашиваемое устройство неактивно (в процессе подключения к устройству произошла ошибка, либо возникла ошибка при съёме параметра), то это будет отмечено модулем и в следующие несколько циклов запуска (по-умолчанию: 5) это устройство опрашиваться не будет, чтобы не создавать задержек в опросе прочих параметров.
  • Для устройств, с которых удалось получить параметры - будет обновлена дата последней активности.
  • Если указан ошибочный параметр (OID), то при опросе устройства - на этом параметре опрос данного устройства будет прекращен.


В случае, если модуль перестал запускаться - на главной странице для операторов, имеющих доступ в настройку системы, будет выводиться соответствующее сообщение

Если модуль выявит нарушение параметров, то кроме уведомления средствами связи, будет выведено также информационное сообщение на главной странице

Общая настройка

Для начала требуется указать список контролируемых параметров и события, при которых считать, что значения этих параметров вышли из нормы.

Параметры можно компоновать в профили опроса

Для всех параметров, которые опрашиваются на данный момент, можно посмотреть текущее состояние и наличие тревог

Ведётся лог опроса параметров (не все значения, а только их изменения), который хранится в базе системы

Имеется также и текущий список опрашиваемых устройств

Настройка в карточке устройства

При редактировании карточки устройства доступен блок, в котором можно выбрать профиль опроса для данного устройства, указать какие-то отдельные параметры для опроса, что не входят в выбранный профиль и указать получателей сообщений о тревоге

В режиме просмотра блок модуля также выводится и из него есть возможность просмотреть текущее состояние параметров и лог изменения их состояния