Проблемы с мониторингом Veeam #2

3

Проверяя бэкапы Veeam мы столкнулись с такой проблемой: неожиданно для всех, перестало заходить в консоль управления, резервное копирование не делается, а заббикс молчит. Беды удалось избежать, но такую важную дырку необходимо залатать.

С чего все началось

Всё началось с такой вот картинки:

Служба не стартует, настроение падает:

Если зайти в историю, то видим как резко куда-то пропали все задачи:Модернизация шаблона

Если Вы настраивали по шаблону из этой записи: Veeam + Zabbix, то вам подойдет инструкция ниже… В этом же шаблоне изменим следующее: добавим мониторинг службы «Veeam Backup Service» и триггер на случай, если работ нет.

Мониторинг службы

Переходим в раздел Настройка -> Шаблоны -> находим шаблон Template VEEAM — Backup and Replication. Для начала нам необходимо создать элемент данных, куда будут собираться данные по службе. Нажимаем на «Элементы данных»

Добавляем новый элемент:

Имя:VeeamBackupSvc (можете поставить какое вам удобно)

Тип: Zabbix агент

Ключ: service.info[VeeamBackupSvc]

Можете задать по своему вкусу, интервал, группу элементов и периоды хранения истории. Я же всё оставил штатно.

Через некоторое время во всех подключенных хостах добавится данный элемент. Теперь нам необходимо создать триггер на работу службы. Переходим в раздел триггеры.

И добавляем новый.

Имя: VeeamBackupSvc not started (можете поставить какое вам удобно)

Важность: Высокий (можете поставить какое вам удобно)

Выражение: {Template VEEAM — Backup and Replication:service.info[VeeamBackupSvc].last(#3)}<>0

Выражение работает так: если в течение 3 последних проверок элемент данных (который мы делали выше) не равен 0, то он должен сработать. Почему не равен 0?  Ответ вот тут.

В результате, если служба не запущена, то у вас будет оповещение.

Мониторинг количество работ (job’s)

Тут нам необходимо лишь создать триггер, т.к. элемент данных уже имеется.

Переходим в раздел триггеров. Создаем новый.

Имя: Veeam no tasks to back up (можете поставить какое вам удобно)

Важность: Высокий (можете поставить какое вам удобно)

Выражение: {Template VEEAM — Backup and Replication:vbr[JobsCount].last(#1)}=0

В результате, если нет заданий для выполнения резервного копирования, то у вас будет оповещение.

Итоги

После проделанной работы вылез ещё один сервер с подобной проблемой. До этих работ все работало, с точки зрения мониторинга, всё правильно. Нет заданий = нет проблем. Надеюсь, что вам, как и мне это будет полезный помощник в работе.