現状の課題
ビジネスを支えるITサービスを正常に提供するのがIT運用の役割である。ジョブ管理においてもサービス視点での管理が重要である。管理するジョブの中には即サービスに影響を与えるジョブもあれば、そうでないジョブもある。ジョブに障害が起こった場合、全てのジョブに対し即時対応するには非常に大きなコストが掛かる。逆に即時対応が必要なものの対応が遅れると、ビジネスに影響が出る。
優先順位を付けて対応する必要があるが、ジョブの障害が発生した場合に、ビジネスに与える影響を判断するのが難しい。特に、異なるアプリケーションが連結したシステムでは、他のジョブへの影響範囲を把握するだけでも大変である。
ITサービスへの影響となるとさらに把握が難しくなる。
解決策
各ジョブとITサービスの相関関係が可視化できれば、的確な優先付けが可能になる。具体的には、サービスに影響を及ぼすクリティカルなジョブを抽出し、そのクリティカルなジョブに異常があった場合は、「サービスに影響がある」というエラー情報を通知する。
ITサービスに影響があるジョブの異常を通知するだけでなく、ITサービスが正常であることも通知するようにすると、軽微なジョブ異常が発生した時のITサービスへの影響の有無が確認でき、より効果的である。
Senju Familyでの実践方法
Senju DevOperation ConductorではジョブとITサービスを関連付けて、サービス視点でジョブの稼働状況を可視化する「ジョブサービス」機能を提供している。
あらかじめ、クリティカルなジョブとサービスを関連付けて登録しておくと、自動的にクリティカルなジョブのステータスを確認し、サービスの状況を一覧表示する。クリティカルなジョブに異常や遅延があれば、サービスの異常として異常イベントを通知する。サービスの状態の一覧表示もできるため、正常であることもひと目で確認できる。
