Проверяя бэкапы Veeam мы столкнулись с такой проблемой: неожиданно для всех, перестало заходить в консоль управления, резервное копирование не делается, а заббикс молчит. Беды удалось избежать, но такую важную дырку необходимо залатать.
Содержание
С чего все началось
Всё началось с такой вот картинки:
Служба не стартует, настроение падает:
Если зайти в историю, то видим как резко куда-то пропали все задачи:Модернизация шаблона
Если Вы настраивали по шаблону из этой записи: Veeam + Zabbix, то вам подойдет инструкция ниже… В этом же шаблоне изменим следующее: добавим мониторинг службы «Veeam Backup Service» и триггер на случай, если работ нет.
Мониторинг службы
Переходим в раздел Настройка -> Шаблоны -> находим шаблон Template VEEAM — Backup and Replication. Для начала нам необходимо создать элемент данных, куда будут собираться данные по службе. Нажимаем на «Элементы данных»
Имя:VeeamBackupSvc (можете поставить какое вам удобно)
Тип: Zabbix агент
Ключ: service.info[VeeamBackupSvc]
Можете задать по своему вкусу, интервал, группу элементов и периоды хранения истории. Я же всё оставил штатно.
Через некоторое время во всех подключенных хостах добавится данный элемент. Теперь нам необходимо создать триггер на работу службы. Переходим в раздел триггеры.
И добавляем новый.
Имя: VeeamBackupSvc not started (можете поставить какое вам удобно)
Важность: Высокий (можете поставить какое вам удобно)
Выражение: {Template VEEAM — Backup and Replication:service.info[VeeamBackupSvc].last(#3)}<>0
Выражение работает так: если в течение 3 последних проверок элемент данных (который мы делали выше) не равен 0, то он должен сработать. Почему не равен 0? Ответ вот тут.
В результате, если служба не запущена, то у вас будет оповещение.
Мониторинг количество работ (job’s)
Тут нам необходимо лишь создать триггер, т.к. элемент данных уже имеется.
Переходим в раздел триггеров. Создаем новый.
Имя: Veeam no tasks to back up (можете поставить какое вам удобно)
Важность: Высокий (можете поставить какое вам удобно)
Выражение: {Template VEEAM — Backup and Replication:vbr[JobsCount].last(#1)}=0
В результате, если нет заданий для выполнения резервного копирования, то у вас будет оповещение.
Итоги
После проделанной работы вылез ещё один сервер с подобной проблемой. До этих работ все работало, с точки зрения мониторинга, всё правильно. Нет заданий = нет проблем. Надеюсь, что вам, как и мне это будет полезный помощник в работе.
Истинные джедаи мониторят состояние служб на серверах по умолчанию. Благо, стандартный виндовый шаблон все это умеет
Я отключаю сбор служб по дефолту, слишком много того, чего мне не нужно. Легче шаблон под нужные службы сделать или же руками добавить :)
Не добавляются 2 триггера, элемент данных при создании триггера выходит ошибка
Детали Не удалось добавить триггер
Детали Не удалось добавить триггер