Я хотел бы отслеживать системный сервис на множестве хостов, на которых все работают centos. Статус можно легко получить из systemctl, но кто-нибудь знает, как отправить электронное письмо, если служба умирает (то есть состояние службы не "работает")?
Я хотел бы избежать отправки сотен электронных писем, если сервис не работает в течение нескольких часов, что может означать отказ от краткосрочных заданий cron. Я хотел бы, возможно, 1 электронное письмо, если сервис не работает, возможно, целых 1 час, но даже это похоже на многое.
Я слышал, что Nagios, Zabbix или Kapacitor могли бы отвечать всем требованиям, но я не уверен, что будет лучшим решением для такого рода проблем. Любой совет будет очень полезным.