対策の種類	概要	具体例
入口対策	ウイルスやマルウェアなどの侵入を防ぐための対策	不正侵入検知システムの導入不正侵入防止システムの導入　など
内部対策	侵入による異常を検知して、被害が出る前に対処するための対策	ウイルス対策ソフトの導入ログ監視の実施　など
出口対策	内側から外部への情報の持ち出しが行えないようにする対策	社外へのアクセス経路の制限データ損失防止の実施　など

サーバやネットワークの負荷を分散する

サーバやネットワークの負荷を分散することで、システム障害によってサーバ・ネットワーク全体が停止する事態を回避できます。

負荷の分散とは、特定のサーバに負荷が集中しないようにほかのサーバへと処理を均一に分散することです。万が一、1つのサーバが停止したとしても、ほかのサーバを利用することでシステムを継続的に稼働できるようになります。

サーバの冗長化を実施する

サーバの冗長化を実施することで、システム障害時の影響を抑えられます。

サーバの冗長化とは、予備のサーバやネットワーク機器を用意して並列で稼働させるシステム構築の方法です。

システム障害が発生した場合に、予備のサーバやネットワーク機器に切り替えることによって継続的に稼働できるようになります。

また、複数のサーバを運用することで、メンテナンスや改修を行う際に発生するサービスの停止時間を最小限に抑えることが可能です。

②システム障害発生時の復旧を迅速化する

システム障害発生時の復旧を迅速化する方法としては、コンティンジェンシープランの策定や障害対応のフロー作成、DR対策の実施などが考えられます。

コンティンジェンシープランを策定する

システム障害による損害を最小限に抑えるには、コンティンジェンシープランを策定して、システム障害が発生した際の代替策・復旧策を確立しておくことが重要です。

コンティンジェンシープランとは、不足の事態が発生した際に事業活動への影響を最小限に食い止めるための基本の行動方針や業務体制を定めた計画のことです。

コンティンジェンシープランの策定にあたっては、以下の項目を考慮して業務遂行に必要な経営資源や代替策などを検討します。

▼コンティンジェンシープランを策定する際に考慮する項目

項目	検討する内容
復旧する状態	復旧発生時点の近くまでどれくらい戻れるか
復旧までの時間	中核となる業務（システム）の停止時間をどれくらい容認できるか
継続する業務	中核となる業務（システム）は何で、レベルダウンがどれくらい容認できるか

コンティンジェンシープランを策定したあとは、障害訓練を実施して従業員が緊急時に対応できるようにしておく必要があります。

障害対応のフローを定める

システム障害が発生した際の対応フローを策定して社内に周知することで、復旧を迅速に行いやすくなります。

システム障害の内容・範囲・業務への影響度・セキュリティ上のリスクなどを調査したうえで関係者への報告を行い、業務を継続するための代替策を検討します。

また、復旧を行うための作業計画や手順を作成して、原因の特定に時間がかかる場合の暫定措置を検討しておくことも大切です。

▼障害発生時の対応フロー

障害事象の確認
関係者への報告
障害による影響範囲の調査と代替策の検討
解析と仮説検証による障害原因の特定
作業計画に基づいた復旧作業の実施
報告書の作成と再発防止のための対策の実施

システム障害の対応フローについてはこちらの記事をご確認ください。

障害対応のフローはどうする？実施のポイントや障害の発生リスクを防ぐための5つの対策障害発生時の迅速な対応フローとリスク軽減策を解説。社内システムの安定運用を実現するための3つの対策やITアウトソーシングの活用法を紹介し、業務の継続性を確保する具体的な方法を今すぐチェック。株式会社FGLテクノソリューションズ

DR対策を実施する

DR対策を実施することで、計画的な復旧が行いやすくなります。

DR（Disaster Recovery）対策とは、自然災害やセキュリティ上のインシデントなどによって発生したシステム障害を復旧するための対策のことです。

被害の最小化や迅速な問題解決を図るために、リスクごとに障害のシナリオを想定した復旧プランを立てます。DR対策の実施にあたっては、3つの目標値を設定して具体的な取り組みを検討することがポイントです。

▼3つの目標値

目標値	詳細
RPO（目標復旧地点）	システム障害の発生前において、過去のどの地点までデータを復元するかを定めた目標値
RTO（目標復旧時間）	システム障害の発生後に組織の業務が停止しても許容できる最大時間を定めた目標値
RLO（目標復旧レベル）	平常稼働時を100％として、どれくらいの割合でシステムを復旧させるのかを定めた目標値

③再発を防止するための体制を整備する

システム障害の再発を防止するには、データの収集・分析や従業員のインシデント訓練などを行う必要があります。また、ITリスクアセスメントの実施も有効です。

システム障害に関するデータを収集・分析する

発生したシステム障害に関するデータを収集・分析することで障害の原因を明確にしたうえで適切な対策を策定しやすくなります。

▼収集・分析するデータの例

障害の概要
原因
原因の起因となった工程
原因の起因となった変更内容
対応内容
障害の影響　など

収集・分析した内容は報告書にまとめることで、メンバー間での共有やノウハウとしての蓄積が効率的に行えます。

インシデント訓練を実施する

障害発生時の対応フローを策定したうえで、実践できるように訓練を行うことで、システム障害の再発防止が図れます。

インシデント訓練は、従業員の意識や対応の習熟度を高めるだけでなく、対応フロー自体に問題がないかの見直しを行うためにも重要です。

ITリスクアセスメントを実施する

システム障害の再発防止のためには、ITリスクアセスメントの実施も有効です。

ITリスクアセスメントとは、自社における現状のセキュリティリスクを洗い出して分析したうえで対策を講じる手法です。

この際、セキュリティリスクによる影響度と発生可能性に基づく評価を行うことが欠かせません。これによって対策するリスクの優先順位が明確になり、自社のリソースを効率的に利用できます。

なお、システム障害の対応をアウトソーシングすることも可能です。メリットはこちらの資料をご確認ください。

＞＞社内システム運用管理業務トータルサポートサービスに関する資料ダウンロードはこちら

まとめ

この記事では、システム障害への対応力について以下の内容を解説しました。

システム障害の対応力“ITレジリエンス”を強化する重要性
ITレジリエンスを強化する3つのポイント

システム障害に備えて予防策を講じていても、サイバー攻撃や災害などによって不具合・停止などのトラブルが起こる可能性があります。システム停止による損害を最小限に抑えるには、異常を検知して迅速な復旧対応ができるITレジリエンスを強化することが重要です。

ITレジリエンスを強化するには、予防・復旧・再発防止の3つの観点からシステム障害への対策に取り組むことが欠かせません。

『FGLテクノソリューションズ』の社内システム運用サービスでは、事業活動の基盤となるITインフラの監視の総合的な監視と障害対応の代行を承っております。

サービスの詳細については、こちらから資料をダウンロードしていただけます。

霜島裕也

2022年にFTSへ入社。社内情シス業務アウトソーシングサービスのマーケティング兼プリセールスを担当している。最近は法務関連の事務局にも従事。IT関連資格としてPMP、ITコーディネータを保有し、現在も維持している。入社前の1991年～2015年は総合電機メーカーにて、総務、販売企画、営業、SE、プロジェクトマネジメントなど幅広い業務を経験。

システム障害への対応力を高めるには？ ITレジリエンスを強化する3つのポイント

システム障害の対応力“ITレジリエンス”を強化する重要性

ITレジリエンスを強化する3つのポイント

①システム障害の予防策を実施する

システム監視を自動化する

多層防御を取り入れる