Мониторинг¶
Мониторинг - модуль системы Smartswitch, который занимается мониторингом (проверкой на работоспособность) различных сервисов на локальном хосте или на удаленных серверах, а также сетевой доступности удаленных серверов.
Эта функциональность используется для проверки работоспособности сервисов на удаленных и локальных системах.
При нахождении проблемы, система высылает предупреждающее письмо на сконфигурированный адрес e-mail.
Функциональность обеспечивается приложением-демоном /usr/local/sbin/smartswitch/monitord.
Это приложение после запуска периодически опрашивает Наблюдаемые сервисы, сконфигурированные на Хостах.
Наблюдаемые сервисы содержит bash скрипт, который используется для проверки работоспособности данного сервиса.
Этот скрипт обычно вызывает внешние программы, которые и производят проверку самого сервиса.
При вызове скрипта ему передается имя хоста из Хосты.
Система при установке по умолчанию имеет несколько предварительно сконфигурированных Наблюдаемых сервиса:
- ping - проверка достижимости хоста по ping.
Рапортируется проблема если хоть 1 пакет ICMP был не отвечен. - h323 - проверка работоспособности сервиса H.323
- snmp-disk - проверка лимитов по занятому месту на жестком диске
- ping-100 - проверка достижимости хоста по ping.
Рапортируется проблема если 100% пакетов ICMP были не отвечены. - snmp-availablility - проверка работоспособности SNMP на удаленном сервере
- snmp-openfiles - проверка лимита по открытым файлам на удаленном сервере
После вызова скрипта, приложение-демон проверяет строку, которую возвращает скрипт.
Если строка пустая, считается, что ошибки не произошло.
Если строка непустая, считается, что произошла ошибка, и эта строка:
- добавляется в базу ошибок
- добавляется в письмо, отсылаемое администратору.
Для уведомления про ошибку используются Уведомители, настраиваемые на каждом Хосте.
Уведомления по e-email отсылаются не каждый раз, когда обнаруживается ошибка, а с определенным периодом.
В письме в дайджест собираются все ошибки, которые были за последний период.
В противном случае администратор будет завален спамом.
Для контроля периода отсылки уведомлений используются период уведомлений (сек) и таймаут устаревания уведомления (сек)
Кроме отсылки уведомлений по e-mail, все ошибки можно просмотреть через отчет Уведомления.