Usm observer
Эта функция является одной из возможностью |
usm_observer - это модуль для постоянного контроля средствами SNMP настраиваемых показателей у устройств и оповещения сотрудников и подразделений о фактах выхода значений этих показателей за пределы установленных значений.
Данный модуль является заменой устаревшему модулю us_control
Общие данные
Язык модуля: Python
Текущая версия: см. на странице: Модули
Статус модуля: Платный
Необходимые модули Perl:
DBI Time::Local threads Net::SNMP FindBin
Информацию по установке модуля и общую информацию для всех модулей см. на странице: Модули
Настройка модуля осуществляется в файле us_config.tmp
Параметры
$zuserver - адрес сервера с UserSide $zuuser - имя пользователя для доступа к базе UserSide $zupass - пароль для доступа к базе UserSide $zubase - имя базы данных UserSide $ps_logpath - путь к логам модуля $zsilence - не выводить уведомления о работе модуля в консоль $zlost_count - не опрашивать неактивные устройства N-циклов запуска (в случае определения их неактивности). По-умолчанию: 5
Запуск модуля
- Настройка - Модули - us_control - Включаем работу модуля
- Запускаем для теста модуль вручную и убедимся, что ошибок не возникает
perl us_control.pl
- Далее настраиваем параметры, профили и устройства опроса (см. ниже)
- После выполнения настройки - вновь вручную запускаем модуль и убедимся снова, что ошибок нет
Опрос параметров выполняется в многопоточном режиме. По 500 параметров на поток.
Модуль требуется прописать в системный cron с частотой запуска - ежеминутно. Если контролируемых параметров очень много, то разумным является менее частый запуск.
* * * * * perl us_control.pl &> /dev/null
Логика работы
- Каждый запуск модуль проверяет состояние SNMP-параметров у контролируемых устройств. Если значение параметра выходит за пределы допустимого, то считается, что произошла тревога. Тревожных параметров на устройстве может быть несколько. По каждому устройству, где был найден тревожный параметр или наоборот - параметр пришёл в норму - формируется электронное письмо и/или SMS для выбранного (на уровне каждого устройства) круга получателей
- По каждому устройству формируется отдельное письмо/сообщение, в котором будут все параметры, состояние (тревога/норма) которых изменилось. В письме информация будет представлена развёрнуто, в SMS - компактно
- Следующее сообщение будет прислано только в случае, если изменился вновь какой-то параметр
- Если в процессе опроса будет выяснено, что опрашиваемое устройство неактивно (в процессе подключения к устройству произошла ошибка, либо возникла ошибка при съёме параметра), то это будет отмечено модулем и в следующие несколько циклов запуска (по-умолчанию: 5) это устройство опрашиваться не будет, чтобы не создавать задержек в опросе прочих параметров.
- Для устройств, с которых удалось получить параметры - будет обновлена дата последней активности.
- Если указан ошибочный параметр (OID), то при опросе устройства - на этом параметре опрос данного устройства будет прекращен.
В случае, если модуль перестал запускаться - на главной странице для операторов, имеющих доступ в настройку системы, будет выводиться соответствующее сообщение
Если модуль выявит нарушение параметров, то кроме уведомления средствами связи, будет выведено также информационное сообщение на главной странице
Общая настройка
Для начала требуется указать список контролируемых параметров и события, при которых считать, что значения этих параметров вышли из нормы.
Параметры можно компоновать в профили опроса
Для всех параметров, которые опрашиваются на данный момент, можно посмотреть текущее состояние и наличие тревог
Ведётся лог опроса параметров (не все значения, а только их изменения), который хранится в базе системы
Имеется также и текущий список опрашиваемых устройств
Настройка в карточке устройства
При редактировании карточки оборудования доступен блок, в котором можно выбрать профиль опроса для данного устройства, указать какие-то отдельные параметры для опроса, что не входят в выбранный профиль и указать получателей сообщений о тревоге
В режиме просмотра блок модуля также выводится и из него есть возможность просмотреть текущее состояние параметров и лог изменения их состояния