2014/08/10 CentOS6.5/PandoraFMS5.0SP3





ダウンタイムスケジュールを構成する

監視アラームの付き物といえば、ダウンタイムスケジュールです。
特定の日時に、サーバを計画的に再起動したり電源を落としたりするから、その間アラームを発生させないことです。

ダウンタイムスケジュールはカレンダー的インターフェイスで細かく日時が指定できることが理想ですが、PandoraFMSではそういう仕組みになっていません。

※2018/7/22追記
Pandora7時点で、各エージェントのモジュールごとに、計画停止(ダウンタイムスケジュール)を設定することが可能になっています






PandoraFMSのダウンタイムの仕組み

PandoraFMSではダウンタイムスケジュールは、アラートテンプレートそのもので設定します。
指定できるのは「障害を発生させる時間」です。


毎日監視を4時から始めて2時に終了するということは、2時から4時の間は監視しないということです。

しかし、みんなで共用するはずのアラートテンプレート自体に監視時間を設定するということは、他の監視エージェントにも影響してしまいます。

ということは

・24時間稼働しているサーバ
・毎日23時から翌6時までシャットダウンしているサーバ
・日曜 2時に再起動するサーバ

 の、3種類がある場合、アラートテンプレートも

・Critical condition(常時稼働サーバ用)
・Critical condition(平日6-23時監視)
・Critical condition(月-土24時間監視) & Critical condition(日曜2時再起動)

 の、4類が必要です。

PandoraFMSでは特定曜日の特定時間のみイベントを除外することはできないので、日曜3時に再起動するなら、アラートテンプレートは平日用(24時間)+日曜用(AM4:00開始・AM3:00終了)の2つ必要です。
全然フレキシブルじゃないです。

サーバ同士でアラートテンプレートを共用するより、初めから専用のアラートテンプレートを用意しておいたほうが得策のようです。




毎週日曜深夜2時に再起動するサーバ用のアラートテンプレートを設定する

1.平日用テンプレートを作成する

まず平日用のアラートテンプレートを作成。それらしい名前を付けます。



日曜日から監視を外します。月から土は24時間監視です。

そのほか、アクションパラメータはすでに構築している他のアラートテンプレートの値に揃えます。




2.日曜日のアラートテンプレートを作成

日曜用のアラートテンプレートを作成。それらしい名前を付けます。




日曜日のみ監視します。
再起動は3時に実施する予定なので、監視時間は3:30に開始し、3:00に終了します。
つまり3:00には、監視が終了しているはずです。




3.サーバへ2つを割り当てる


アラームテンプレートを2つ設定します。
これにより、日曜3:00-3:30以外の時間が監視されます。




除外予定時間内に障害を発生させる

予定された通り、3:00−3:30の間でサーバをダウンさせてみます。
HostAliveモジュールのエラーは発生しますが、関連づけられた障害アラートはグリーンのまま、障害として認識されていないのがわかります。


もしも予定された時刻を超えてサーバがダウンし続けた場合、その後に障害アラートが発生します。
つまり3時30分過ぎに障害メールが送信されます。




このように、PandoraFMSではダウンタイムスケジュールはアラートテンプレート自体の仕掛けが必要です。

もし一つのサーバにHostAliveやサービスポート監視など、障害通知がたくさん設定されているのなら、一つのモジュールごとに複数のアラートテンプレートを割り当てる必要があります。
つまり、1台のサーバのためだけにたくさんアラートテンプレートを作成する必要があります。

すでにアラートが設定された複数のサーバへ新たなダウンタイムスケジュールを構成する場合は設定工数が多くなるため厄介です。

その場合は、別項の「アラームテンプレートの一括設定・削除」でまとめて設定します。






prev.gif