Project

General

Profile

Мониторинг

Мониторинг - модуль системы Smartswitch, который занимается мониторингом (проверкой на работоспособность) различных сервисов на локальном хосте или на удаленных серверах, а также сетевой доступности удаленных серверов.
Эта функциональность используется для проверки работоспособности сервисов на удаленных и локальных системах.
При нахождении проблемы, система высылает предупреждающее письмо на сконфигурированный адрес e-mail.

Функциональность обеспечивается приложением-демоном /usr/local/sbin/smartswitch/monitord.
Это приложение после запуска периодически опрашивает Наблюдаемые сервисы, сконфигурированные на Хостах.
Наблюдаемые сервисы содержит bash скрипт, который используется для проверки работоспособности данного сервиса.
Этот скрипт обычно вызывает внешние программы, которые и производят проверку самого сервиса.
При вызове скрипта ему передается имя хоста из Хосты.

Система при установке по умолчанию имеет несколько предварительно сконфигурированных Наблюдаемых сервиса:

  • ping - проверка достижимости хоста по ping.
    Рапортируется проблема если хоть 1 пакет ICMP был не отвечен.
  • h323 - проверка работоспособности сервиса H.323
  • snmp-disk - проверка лимитов по занятому месту на жестком диске
  • ping-100 - проверка достижимости хоста по ping.
    Рапортируется проблема если 100% пакетов ICMP были не отвечены.
  • snmp-availablility - проверка работоспособности SNMP на удаленном сервере
  • snmp-openfiles - проверка лимита по открытым файлам на удаленном сервере

После вызова скрипта, приложение-демон проверяет строку, которую возвращает скрипт.
Если строка пустая, считается, что ошибки не произошло.
Если строка непустая, считается, что произошла ошибка, и эта строка:
- добавляется в базу ошибок
- добавляется в письмо, отсылаемое администратору.

Для уведомления про ошибку используются Уведомители, настраиваемые на каждом Хосте.
Уведомления по e-email отсылаются не каждый раз, когда обнаруживается ошибка, а с определенным периодом.
В письме в дайджест собираются все ошибки, которые были за последний период.
В противном случае администратор будет завален спамом.
Для контроля периода отсылки уведомлений используются период уведомлений (сек) и таймаут устаревания уведомления (сек)

Кроме отсылки уведомлений по e-mail, все ошибки можно просмотреть через отчет Уведомления.

English translation

Also available in: PDF HTML TXT