販売支援業 C社 様
バックグラウンド
顧客ビジネス
・製造業である親会社向けの販売支援を実施 (プロモーション企画&実施、イベント展開、キャンペーン実施)
運用対象システム
・販売支援システム
プロジェクト背景
・販売支援システムは、イベント展開中やキャンペーン広告実施中など期間限定でアクセスが増加し高負荷となる。
・これまでは、ピークに合わせてインフラリソースを調達していたが、AWSに移行して、必要なタイミングに必要な分だけリソースを調達してインフラコストの適正化を行う。
要件及び課題
・これまでピークに合わせたインフラ投資しか出来なかった。今後は必要なタイミングに必要な分だけリソースを調達できる運用を行いたい。
・突発的なリクエスト増は、1週間ほど前に分かるので、1週間以内でリソース増加対応が必要
・ただし、人手のみの対応だと即時対応が難しく、また作業ミスも恐いので出来るだけ自動化(半自動化)することが必要。
・業務サーバの監視や障害対応は既存のOSS監視ツールを使用しているが、監視ツール自身の監視を行い耐障害性を向上したい。
・AZ障害の検知や障害発生時の別AZでのシステム立ちあげを行うためにシステム外部から監視して障害復旧できる仕組みが欲しい。
システム構成図

mPLAT採用理由
・リソース調達の自動化には、ジョブやランブックの機能が必要だが、既存のOSS監視ツールには無い機能なので、mPLATのジョブ、ランブックを利用して運用自動化を推進できるため
・既存のOSS監視ツール自身の運用監視をマネージド型サービスであるmPLATに任せられるため
・mPLATはサービス型であるため初期導入コストが安く、導入も容易であること。また維持管理が不要である点
導入後の効果
・mPLATのジョブ機能で、①計画的な停止起動、②リソース需要予測に基づいたEC2インスタンスタイプの変更を行い、インフラコストの最適化に成功。また、イベントやキャンペーン実施前に、 インフラリソースの必要量を予測して直前にEC2インスタンスタイプを増減する運用をジョブ機能を用いて実現(インフラリソース調達の半自動化を実現)
・既存の運用監視ツールの監視や障害時の自動復旧を実施し、耐障害性向上
・運用監視ツールと連携して、障害アラートをmPLAT側で一元管理。障害コールはmPLATの自動電話機能を利用することで障害発生から復旧までの時間を削減することに成功
・AZ障害時には自動で別AZでLaunchする仕組みを実装し、AZ障害の切替え負荷を削減してサービス停止時間を最小化
今後の期待
・AWS移行検討中の他システムについても、mPLATを利用して実装した仕組みを横展開してコスト削減を狙う
・障害アラートをmPLAT側に蓄積しているので、インシデント管理、問題管理などを実施しサービスレベル向上を狙う
・mPLATのオペレーションサービスを利用して、24時間365日の運用オペレーションのアウトソーシングも検討中
・mPLATのダッシュボードオプションを利用して、システム稼働率の見える化し、サービスレベル向上を実施予定