2012年6月、データセンターとホスティングサービスで大規模障害が発生しました。ひとつは富士通の「館林システムセンター」、もうひとつはファーストサーバの複数のサービスです。どちらも多大な影響が発生し、ユーザーのものを含む膨大なデータが失われました。今回は、この2つの大規模障害の原因と、サービスの利用時にユーザーが注意すべきことをまとめてみたいと思います。三重の対策がすべて機能しなかった「館林システムセンター」6月7日、複数の銀行で同時多発的にシステム障害が発生しました。具体的には、東京スター銀行のすべてのATM、サークルKサンクスの子会社とりそな銀行が運営するATMの一部、ソニー銀行のすべてのシステム、「ニフティクラウド」の一部サーバ、スクウェア・エニックスのオンラインゲームなどが長時間にわたって停止しました。これらのサーバが富士通の「館林システムセンター」にあったのです。この障害に関する情報は少ないのですが、ニフティクラウドの報告書から原因がある程度わかります。原因は同センターの無停電電源装置(UPS)の故障で、これにより約7%のサーバに電力が供給できなかったことだといいます。同センターでは、UPSに障害が発生すると冗長系のUPSが作動するようになっており、すべてのUPSが停止した場合はUPSを介さずに電力を供給するようにしていました。いわば三重の対策を実施していたわけです。原因となったのは…※本記事は有料版に全文を掲載します