4.5.16. サーバースローダウン監視¶
4.5.16.1. サーバースローダウン監視の概要¶
サーバースローダウン監視では、千手エージェントが稼働するにあたり問題となるOS/ハードウェア/ストレージ/ネットワーク等についての障害検知や検査を行います。サーバースローダウン監視はホスト、タイマ、ディスク、ネットワークに関する項目のチェック回数、しきい値等を定義ファイルから読み込み動作します。チェック結果がしきい値を超えた場合、設定された定義ファイルによりメッセージ「!ANMS01」を送信することができます。
サーバースローダウン監視の定義ファイルの設定方法については、 サーバースローダウン監視の定義ファイルの設定 を参照して下さい。
4.5.16.2. サーバースローダウン監視の定義ファイルの設定¶
千手エージェントからサーバースローダウン監視を行う場合には、ユーザーの定義ファイルを作成する必要があります。
以下のデフォルト定義ファイルをコピーして、デフォルト定義ファイルと同一ディレクトリ内にユーザー定義ファイルsjANM_sysChk_user.defを作成し、設定値を任意の値に変更することにより、サーバースローダウン監視設定を行うことができます。
デフォルト定義ファイル名:(千手稼働アカウントのホームディレクトリ)\dat\anm\sjANM_sysChk.def
ユーザー定義ファイル名:(千手稼働アカウントのホームディレクトリ)\dat\anm\sjANM_sysChk_user.def
定義ファイルの記述方法は以下のとおりです。
項目 |
内容 |
---|---|
# |
コメントを表します。 |
Interval |
サーバースローダウン監視間隔です。(間隔:mm)15、30、60の間隔で指定します。(デフォルト:30) |
SystemCheck |
サーバースローダウン監視を行うかどうかを指定します。on:監視する/off:監視しない(デフォルト:off) |
RetryInterval |
サーバースローダウンプロセスの起動に失敗した場合、リトライ起動の秒数を指定します。1~60の範囲で指定します。(デフォルト:30) |
RetryCount |
サーバースローダウンプロセスの起動に失敗した場合、リトライ起動の回数を指定します。1~10の範囲で指定します。(デフォルト:5) |
SendMessage |
しきい値を超えた場合、メッセージ!ANMS01を送信するかどうかを指定します。on:送信する/off:送信しない(デフォルト:off) |
Hostchecknum |
ホストチェックの回数を指定します。1~20の範囲で指定します。(デフォルト:10) |
Timerchecknum |
タイマチェックの回数を指定します。1~20の範囲で指定します。(デフォルト:10) |
Diskchecknum |
ディスクI/Oチェックの回数を指定します。1~20の範囲で指定します。(デフォルト:10) |
Diskcheckunlinkfile |
ディスクI/Oチェック時に作成した一時ファイル数を指定します。1~20の範囲で指定します。(デフォルト:10) |
Diskcheckfilesize |
ディスクI/Oチェック時に作成した一時ファイルのサイズを指定します。1~2048の範囲で指定します。(byte)(デフォルト:1024) |
Netchecknum |
ネットワークチェックの回数を指定します。1~20の範囲で指定します。(デフォルト:10) |
HostcheckthresholdTimes |
ホストチェックの倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
HostcheckthresholdMax |
ホストチェックの最大しきい値を指定します。(マイクロ秒) |
TimercheckthresholdTimes |
タイマチェックの倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
TimercheckthresholdMax |
タイマチェックの最大しきい値を指定します。(マイクロ秒) |
WritecheckthresholdTimes |
ディスクI/Oチェック(書き込み)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
WritecheckthresholdMax |
ディスクI/Oチェック(書き込み)の最大しきい値を指定します。(マイクロ秒) |
StatcheckthresholdTimes |
ディスクI/Oチェック(ステータス)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
StatcheckthresholdMax |
ディスクI/Oチェック(ステータス)の最大しきい値を指定します。(マイクロ秒) |
ReadcheckthresholdTimes |
ディスクI/Oチェック(読み込み)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
ReadcheckthresholdMax |
ディスクI/Oチェック(読み込み)の最大しきい値を指定します。(マイクロ秒) |
DeletecheckthresholdTimes |
ディスクI/Oチェック(削除)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
DeletecheckthresholdMax |
ディスクI/Oチェック(削除)の最大しきい値を指定します。(マイクロ秒) |
NameResolvecheckthresholdTimes |
ネットワークチェック(名前解決)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
NameResolvecheckthresholdMax |
ネットワークチェック(名前解決)の最大しきい値を指定します。(マイクロ秒) |
ConnectcheckthresholdTimes |
ネットワークチェック(接続)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
ConnectcheckthresholdMax |
ネットワークチェック(接続)の最大しきい値を指定します。(マイクロ秒) |
SendReceivecheckthresholdTimes |
ネットワークチェック(送信、受信)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
SendReceivecheckthresholdMax |
ネットワークチェック(送信、受信)の最大しきい値を指定します。(マイクロ秒) |
DisconnectcheckthresholdTimes |
ネットワークチェック(切断)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数 |
DisconnectcheckthresholdMax |
ネットワークチェック(切断)の最大しきい値を指定します。(マイクロ秒) |
4.5.16.3. サーバースローダウン監視の環境変数の設定¶
変数名 |
SJ_SYSCHK_PREVCNT |
設定値 |
1~10 |
説明 |
蓄積回数 SJ_SYSCHK_WAY が未設定または0の場合に、前何回分のデータを蓄積するを指定します。未設定の場合、デフォルトは前5回分のデータを蓄積します。 |
変数名 |
SJ_SYSCHK_WAY |
設定値 |
0または 1 |
説明 |
しきい値の計算方法 未設定または0の場合に、しきい値 = 前何回分の平均値 × 倍数 1の場合に、しきい値 = 前日の同じ時間帯の値 × 倍数 |
設定手順
- 千手稼働アカウント権限
千手エージェントに千手稼働アカウントでログオンして下さい。
- 環境変数の設定
- のOSがUNIX/Linuxの場合
ターミナルから以下のコマンドを実行して下さい。(大文字、小文字に注意して下さい)
% sj_source.com -cSJ_SYSCHK_WAY=1 success % exit
- OSがWindowsの場合
コマンドプロンプトから以下のコマンドを実行して下さい。(大文字、小文字に注意して下さい)
$ sj_source -cSJ_SYSCHK_WAY=1 環境変数反映コマンドは正常に終了しました。 $ exit
設定した環境変数を確認するには、
- OSがUNIX/Linuxの場合
千手稼働アカウントで再ログインした後、以下のコマンドを実行して下さい。
% env | grep SJ_SYSCHK_WAY
- OSがWindowsの場合
コマンドプロンプトを再起動後、以下のコマンドを実行して下さい。
$ sj_getenv SJ_SYSCHK_WAY
- 千手プロセスのダウン/アップ
この後、千手エージェントのリブートを行うか、千手ブラウザのノードモニタより、"sjANM_vmstatd"プロセスを再起動して下さい。