栃木県のJavaエンジニア、WEBプログラマーのためのサイト

2020.07.22crondが死んでたので zabbix で死活を監視する話

いつの間にか crond が死んでいました..。

Linux OOM Killerに殺されたのか、なにか他に原因があったのかは定かではありません。
そのせいで、let’s encrypt の自動更新がされず、証明書が期限切れを起こしました。

これはいかん。

zabbixでcrondが死んだら警告を出さねば!

….アイテムがねぇ…orz

作ればいいんだろ、作ればよ〜。

とりあえず zabbix server で新規テンプレート Crond を作ります。
アイテムに crond を keyが proc.num[crond] で。

これでおおよそ大丈夫のはずですが、まれに
proc.num[crond] が取れていないzabbix-agentが…

そういった場合は、agent側から死活をサーバーに通知します。
crondの死活は status で確認できます。
/etc/rc.d/init.d/crond status

runningという文字があれば正常。なければ異常。
runningをカウントすることで確認できます。

/etc/rc.d/init.d/crond status|grep -e running |wc -l

その結果を zabbix-agent から出力します。
zabbix_agentd.conf
UserParameter=crond,/etc/rc.d/init.d/crond status|grep -e running |wc -l

Zabbixサーバー側でcrondをアイテムに追加し、トリガーを設定します。

監視中の数十あるzabbix-agentにコツコツ追加すればいいんだろ?クソがぁ!

この記事について
  • スッキリ (0)
  • 普通 (0)
  • 消化不良 (0)