NRI 野村総合研究所
監視の技8

運用環境のキャパシティやトレンドを把握して
障害をプロアクティブに防ぎたい

現状の課題

日々のサーバー運用において、いつリソースがひっ迫するのかを予測しておくことは非常に重要である。サーバーダウンの障害を起こせば、その企業への信頼低下は避けられないからだ。
そのために、サーバーのリソース利用状況を日々蓄積し、監視しているケースは多い。この場合、ある日のサーバーリソース利用状況を見た時、その値が妥当であるのかを判断したい。どうすればいいのだろうか。
サーバーでジョブスケジュールを利用しているケースの例を基に考えてみる。毎月第1営業日に稼働するジョブであれば、前月の第1営業日と今月の同日を比較しなければ利用状況が妥当であるか判断できない。また適切にロードバランスされているのかどうか確認する必要もある。
このように、ある時点の短いスパンで行うリソースひっ迫状況の監視と、長いスパンで行う増加傾向の判断とリソース枯渇予測という両面でのキャパシティ監視が必要なのである。

図1

解決策

短いタイムスパンでサーバーのリソースひっ迫状況を監視するとともに、その結果を蓄積しておく。蓄積したデータをサマリーし、長いスパンで見た時の増加傾向を判断することで、リソース枯渇の予測が可能となる。
サーバーの役割に応じて、(前月と今月の)同一日のリソース使用状況をクロス分析することで妥当であるかの判断材料となる。同様にジョブスケジュールにおいても、同じ時間帯で稼働するジョブをクロス分析することで、分散処理が効率的に行われているのか判断できる。

Senju Familyでの実践方法

Senju DevOperation Conductorでは「キャパシティ」機能を提供している。監視機能で取得したサーバーのリソース使用状況や負荷状況などを履歴データとして蓄積し、グラフ表示する機能である。グラフは、過去データを重ね合わせることや、カレンダー情報との照会も可能だ。履歴データの解析により、異なる月の同一営業日のリソース使用状況をクロス分析できる。
モニタリングの履歴値、千手メッセージの発行件数履歴を日付および時間帯の2軸にヒートマップで描画するグラフ種別が選択可能であり、ピーク時間帯の前後やその値の増減傾向ならびに変化の周期性や特異なパターンの可視化が可能である。また、レベル別の千手メッセージ発行件数を折れ線で描画するグラフ種別も選択可能であり、レベル別のメッセージ件数推移を確認可能である。本機能により、ジョブの稼働していない時間帯やユーザーがログインしていない時間帯をヒートマップで確認することで、千手マネージャーのメンテナンスのタイミングを決定する目的にも使用可能である。

図2
図3
監視の技 資料一式ダウンロード ツール活用術一覧へ戻る
Contact

Senju Family / mPLATに関するお問い合わせ

ご購入前の製品・サービスに関するお問合せは
Senjuインフォメーションセンター までお願いします。

お問い合わせフォームはこちら

フリーダイヤル・メールでもお受けしております。

0120-736-580

受付時間 平日10:00〜17:00 土日祝祭日、弊社休日を除く

senjuinfo@nri.co.jp