4.5.16. サーバースローダウン監視

4.5.16.1. サーバースローダウン監視の概要

サーバースローダウン監視では、千手エージェントが稼働するにあたり問題となるOS/ハードウェア/ストレージ/ネットワーク等についての障害検知や検査を行います。サーバースローダウン監視はホスト、タイマ、ディスク、ネットワークに関する項目のチェック回数、しきい値等を定義ファイルから読み込み動作します。チェック結果がしきい値を超えた場合、設定された定義ファイルによりメッセージ「!ANMS01」を送信することができます。

サーバースローダウン監視の定義ファイルの設定方法については、 サーバースローダウン監視の定義ファイルの設定 を参照して下さい。

4.5.16.2. サーバースローダウン監視の定義ファイルの設定

千手エージェントからサーバースローダウン監視を行う場合には、ユーザーの定義ファイルを作成する必要があります。

以下のデフォルト定義ファイルをコピーして、デフォルト定義ファイルと同一ディレクトリ内にユーザー定義ファイルsjANM_sysChk_user.defを作成し、設定値を任意の値に変更することにより、サーバースローダウン監視設定を行うことができます。

デフォルト定義ファイル名:(千手稼働アカウントのホームディレクトリ)\dat\anm\sjANM_sysChk.def

ユーザー定義ファイル名:(千手稼働アカウントのホームディレクトリ)\dat\anm\sjANM_sysChk_user.def

定義ファイルの記述方法は以下のとおりです。

項目

内容

#

コメントを表します。

Interval

サーバースローダウン監視間隔です。(間隔:mm)15、30、60の間隔で指定します。(デフォルト:30)

SystemCheck

サーバースローダウン監視を行うかどうかを指定します。on:監視する/off:監視しない(デフォルト:off)

RetryInterval

サーバースローダウンプロセスの起動に失敗した場合、リトライ起動の秒数を指定します。1~60の範囲で指定します。(デフォルト:30)

RetryCount

サーバースローダウンプロセスの起動に失敗した場合、リトライ起動の回数を指定します。1~10の範囲で指定します。(デフォルト:5)

SendMessage

しきい値を超えた場合、メッセージ!ANMS01を送信するかどうかを指定します。on:送信する/off:送信しない(デフォルト:off)

Hostchecknum

ホストチェックの回数を指定します。1~20の範囲で指定します。(デフォルト:10)

Timerchecknum

タイマチェックの回数を指定します。1~20の範囲で指定します。(デフォルト:10)

Diskchecknum

ディスクI/Oチェックの回数を指定します。1~20の範囲で指定します。(デフォルト:10)

Diskcheckunlinkfile

ディスクI/Oチェック時に作成した一時ファイル数を指定します。1~20の範囲で指定します。(デフォルト:10)

Diskcheckfilesize

ディスクI/Oチェック時に作成した一時ファイルのサイズを指定します。1~2048の範囲で指定します。(byte)(デフォルト:1024)

Netchecknum

ネットワークチェックの回数を指定します。1~20の範囲で指定します。(デフォルト:10)

HostcheckthresholdTimes

ホストチェックの倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

HostcheckthresholdMax

ホストチェックの最大しきい値を指定します。(マイクロ秒)

TimercheckthresholdTimes

タイマチェックの倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

TimercheckthresholdMax

タイマチェックの最大しきい値を指定します。(マイクロ秒)

WritecheckthresholdTimes

ディスクI/Oチェック(書き込み)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

WritecheckthresholdMax

ディスクI/Oチェック(書き込み)の最大しきい値を指定します。(マイクロ秒)

StatcheckthresholdTimes

ディスクI/Oチェック(ステータス)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

StatcheckthresholdMax

ディスクI/Oチェック(ステータス)の最大しきい値を指定します。(マイクロ秒)

ReadcheckthresholdTimes

ディスクI/Oチェック(読み込み)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

ReadcheckthresholdMax

ディスクI/Oチェック(読み込み)の最大しきい値を指定します。(マイクロ秒)

DeletecheckthresholdTimes

ディスクI/Oチェック(削除)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

DeletecheckthresholdMax

ディスクI/Oチェック(削除)の最大しきい値を指定します。(マイクロ秒)

NameResolvecheckthresholdTimes

ネットワークチェック(名前解決)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

NameResolvecheckthresholdMax

ネットワークチェック(名前解決)の最大しきい値を指定します。(マイクロ秒)

ConnectcheckthresholdTimes

ネットワークチェック(接続)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

ConnectcheckthresholdMax

ネットワークチェック(接続)の最大しきい値を指定します。(マイクロ秒)

SendReceivecheckthresholdTimes

ネットワークチェック(送信、受信)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

SendReceivecheckthresholdMax

ネットワークチェック(送信、受信)の最大しきい値を指定します。(マイクロ秒)

DisconnectcheckthresholdTimes

ネットワークチェック(切断)の倍数を指定します。しきい値 = 前何回分の平均値または前日同じ時間帯の値 × 倍数

DisconnectcheckthresholdMax

ネットワークチェック(切断)の最大しきい値を指定します。(マイクロ秒)

4.5.16.3. サーバースローダウン監視の環境変数の設定

変数名

SJ_SYSCHK_PREVCNT

設定値

1~10

説明

蓄積回数

SJ_SYSCHK_WAY が未設定または0の場合に、前何回分のデータを蓄積するを指定します。未設定の場合、デフォルトは前5回分のデータを蓄積します。

変数名

SJ_SYSCHK_WAY

設定値

0または 1

説明

しきい値の計算方法

未設定または0の場合に、しきい値 = 前何回分の平均値 × 倍数

1の場合に、しきい値 = 前日の同じ時間帯の値 × 倍数

設定手順

  1. 千手稼働アカウント権限

    千手エージェントに千手稼働アカウントでログオンして下さい。

  2. 環境変数の設定
    • のOSがUNIX/Linuxの場合

      ターミナルから以下のコマンドを実行して下さい。(大文字、小文字に注意して下さい)

      % sj_source.com -cSJ_SYSCHK_WAY=1
      success
      % exit
      
    • OSがWindowsの場合

      コマンドプロンプトから以下のコマンドを実行して下さい。(大文字、小文字に注意して下さい)

      $ sj_source -cSJ_SYSCHK_WAY=1
      環境変数反映コマンドは正常に終了しました。
      $ exit
      

    設定した環境変数を確認するには、

    • OSがUNIX/Linuxの場合

      千手稼働アカウントで再ログインした後、以下のコマンドを実行して下さい。

      % env | grep SJ_SYSCHK_WAY
      
    • OSがWindowsの場合

      コマンドプロンプトを再起動後、以下のコマンドを実行して下さい。

      $ sj_getenv SJ_SYSCHK_WAY
      
  3. 千手プロセスのダウン/アップ

    この後、千手エージェントのリブートを行うか、千手ブラウザのノードモニタより、"sjANM_vmstatd"プロセスを再起動して下さい。