サーバーシステム障害を考える

先日クライアントからメールが使えないと相談がありました。OAシステム大手のリコーさんのメールサーバーがダウンしたようで仕事のメールが使えず困って連絡があったみたいです。

メールサーバーのダウン、これは企業活動において生命線ともいえるインフラなので困りものです。今回のシステム障害は「今回、メールボックスサーバが高負荷状態となり、本来のパフォーマンスを発揮出来ていなかったため、処理出来ず、中継サーバへ受信メールが戻されていたことが障害要因となります」と説明がありました。

運用できなかった時間も26時間に及んだため結構おおごとのシステム障害です。

リコーHPから一部引用

1.概要
(1)発生・復旧日時
2016年8月8日(月) 午前8時00分 ~ 8月9日(火)午前10時13分 復旧

(2)影響内容
・メールの受信が遅延する場合がある
・メールの受信時に認証エラーが表示される場合がある

(3)対象サービス/商品
今回の影響範囲はメールホスティングサービス及び、プロバイダドメインメールサービスとなります。
お客様ホームページの公開および、インターネット接続には影響ありません。

(4)発生した事象
通常、お客様宛に送信されたメールは、中継サーバに蓄積され、その後、中継サーバから、お客様毎 のメールボックス(ストレージ)に送信されます。
今回、メールボックスサーバが高負荷状態となり、本来のパフォーマンスを発揮出来ていなかったため、 処理出来ず、中継サーバへ受信メールが戻されていたことが障害要因となります。
メールボックスサーバの高負荷の原因については、現在調査中です。

メールは業務において必要不可欠のインフラのためもしもに対するバックアップを考える必要があると改めて感じます。自社ドメインで運用するメールアドレスは企業の証明のような部分もあり、違うドメインからのメールを拒否されるリスクなどもあります。おいそれとオープン系の別のアドレスから送りますともいえないケースもあります。

企業の重要インフラであるメールのシステムバックアップ体制はどうあるべきか。

実際のところ社内のメールサーバーでなく、外部委託のメールサーバーは利用者としてはハード面・ソフト面において直接対策を施すということはできません。予備のメールシステムを持つにしてもドメインの問題はありますし、顧客に別のメールアカウントを連絡して暫定的にメールを利用するにしても送信履歴なども本来のメーラーに残らないわけなので注意が必要です。

インフラを提供している会社も大規模なネットワーク攻撃に対する防御なども当然行っていますが、利用者側システムの虚弱性を突くDDOS攻撃など気にすべき点は多々あります。

メールシステムは共用で運用されるサービスの場合、とある利用者が高負荷をサーバーに掛けたため障害がおこるケースも多くあり企業利用のメールサーバーは共用サーバーは注意すべきポイントです。IPA(情報処理機構)のHPなどにシステムのリスクに対する情報セキュリテイの説明などもあるので一読しておく必要はあります。

この記事を書いた人

管理者