|
見やすい警報メールへ (V5の場合)
PandoraFMSのメールを受信してまず思うのが「メールが長すぎる」です。 まずタイトルが長くて、携帯で受信しても肝心のサーバー名が途切れます。
本文は冗長で読みにくいです。警報メールにHelloとかいりません。
メール本文を修正しようとしたとき、設定を見つけにくいのに気付きます。
というのも、警報メールと回復メールの本文設定が別々のところにあるからです。
この点、V6以降では管理やすくなっています。
まずデフォルトの警報メールと回復メールの全文を示し、どこの文がどこの設定に由来しているのか
記載してみます。
送信者はpandora@localhost、受信者はuser1@example.localとしています。
障害メール
Return-Path: <pandora@localhost>
X-Original-To: user1@example.local
Delivered-To: user1@example.local
Received: from localhost.localdomain (unknown [192.168.100.120])
by raspberrypi (Postfix) with ESMTP id D4BC440B1B
for <user1@example.local>; Thu, 2 Jan 2014 16:48:46 +0900 (JST)
Subject: [PANDORA] Alert from agent 192.168.100.240 on module Check HTTP Server アラートアクション設定
X-Mailer: Pandora FMS
Date: Mon, 6 Jan 2014 17:38:27 +0900
Mime-Version: 1.0
Content-Type: text/plain; charset="iso-8859-1"
To: user1@example.local アラートアクション設定
Content-Transfer-Encoding: quoted-printable
From: pandora@localhost pandora_server.conf設定
アラートテンプレート設定(本文)
Hello, this is an automated email coming from Pandora FMS
This alert has been fired because a CRITICAL condition in one of your monit=
ored items:
Agent : 192.168.100.240
Module: Check HTTP Server
Module description:=20
Timestamp 2014-01-06 17:38:27
Current value: 0.00
Thanks for your time.
Best regards
Pandora FMS |
回復メール
Return-Path: <pandora@localhost>
X-Original-To: user1@example.local
Delivered-To: user1@example.local
Received: from localhost.localdomain (unknown [192.168.100.120])
by raspberrypi (Postfix) with ESMTP id 8421340B1B
for <user1@example.local>; Thu, 2 Jan 2014 16:09:39 +0900 (JST)
Subject: [PANDORA] Alert RECOVERED for CRITICAL status on 192.168.100.240 /
Check HTTP Server アラートテンプレート設定 X-Mailer: Pandora FMS
Date: Mon, 6 Jan 2014 16:59:20 +0900
Mime-Version: 1.0
Content-Type: text/plain; charset="iso-8859-1"
To: user1@example.local アラートアクション設定
Content-Transfer-Encoding: quoted-printable
From: pandora@localhost pandora_server.conf設定
アラートテンプレート設定(本文)
Hello, this is an automated email coming from Pandora FMS
This alert has been RECOVERED from a CRITICAL condition in one of your moni=
tored items:
Agent : 192.168.100.240
Module: Check HTTP Server
Module description:=20
Timestamp 2014-01-06 16:59:19
Current value: 1.00
Thanks for your time.
Best regards
Pandora FMS |
ややこしいメール設定をまとめるとこうなります。
障害メール
|
項目
|
回復メール
|
pandora_server.conf (mta_from) |
送信元アドレス
|
pandora_server.conf (mta_from)
|
アラートアクション
|
タイトル
|
アラートテンプレート (ステップ3)
|
アラートアクション
|
送信先アドレス
|
アラートアクション
|
アラートテンプレート(ステップ2)
|
本文
|
アラートテンプレート (ステップ3) |
送信元アドレスと送信先アドレスの設定は共通だとわかったので、まずは忘れましょう。
障害メールのあの冗長な本文は、アラートテンプレートの「障害通知」「拡張フィールド管理」の中の、フィールド3で定義されています。
デフォルトの障害メール設定(アラートテンプレートとアラートアクション)
デフォルトの回復メール設定(アラートテンプレート)
メール文の問題点
・タイトルが長すぎる → 短く簡潔に
・本文に無駄が多い → 必要な情報のみ
そこで、メール設定を以下の通りに提案します。
障害メール
|
タイトル |
アラートアクション
Subject
|
(空白) |
タイトル
|
アラートテンプレート フィールド2
|
[BIZ-System] Critical _agent_ |
本文
|
アラートテンプレート フィールド3
|
Module: _module_
Agent: _agent_
Timestamp _timestamp_
Current value: _data_
|
回復メール
|
タイトル
|
アラートテンプレート
フィールド2
|
[BIZ-System] Recover _agent_ |
本文
|
アラートテンプレート
フィールド3
|
Module: _module_
Agent: _agent_
Timestamp _timestamp_
Current value: _data_
|
障害メール変更後 (アラートアクションとアラートテンプレート)
回復メール変更後(アラートテンプレート)
メールタイトルに監視システムのユニークなキーワードを入れておくと、メール受信後のメール振り分けが
楽になります。
ここでは [BIZ-System] というキーワードを入れてみました。
これにより、障害メールの内容は以下のようになります。
タイトル |
[BIZ-System] Critical WebSv02 | [BIZ-System] Recover WebSv02 |
本文 |
Module: Check HTTP Server
Agent : WebSv02
Timestamp 2014-03-22 17:38:27
Current value: 0.00 | Module: Check HTTP Server
Agent : WebSv02
Timestamp 2014-03-22 17:43:50
Current value: 1.00 |
これでタイトルだけでサーバトラブルとわかり、メール本文でWebSv02というサーバ上のHTTPモジュールで障害が起きたと判断できます。
メールにCurrent valueが含まれているので、メモリ使用率上昇の警告でも数値把握できます。
PandoraFMSは非常に柔軟な設定が可能です。
それゆえに組み合わせは多岐にわたり、最初にルールを考えておかないと後の運用でややこしい作業を生み出しかねません。
本ページでは、メールアクションのメールタイトルを削除し、メール送信先だけにしました。
メールタイトルとメール本文は、アラートテンプレート側で定義しました。
これ以降、アラートテンプレートを作成した場合、忘れずメールタイトルと本文を定義しましょう。
この設定は
・アラートメールの通報形式は一種類でいい
・イベント情報のメール以外の取り扱い(ログ出力やSNS送信など)はニーズがない
ことを前提とし、管理のわかりやすさを重視しました。
結果、以下のような利点があります。
・障害イベントと警告イベントで、メールタイトルを変えることができる
・警報メールの送信先アドレスは何パターンか考えられる
結果的に、PandoraFMSのメール構造を研究することになりましたでの、もっと詳しい情報が欲しい方、もっと拡張的な監視設計をしておきたい方は、そちらの情報も参照してください。
|
|