-.Jに聞け:今までに経験した、馬鹿らしい障害原因は?(/.J)
色々と「あるある」話すぎて困る(笑
いくつか事例おば。
うちが運用担当していたネットワーク群が丁度、顧客に対して
プレゼンしているときに本部拠点が完全ダウン。
上から下まで大騒ぎでしたが、原因はネットワークループでしたとさ。
サーバは通信出来ないだけで生きていたので、コアとフロアー間を
物理的に切断して基幹部復旧。とか、結構ローテクな方法で復旧させました。
別の顧客で、ネットワーク設置作業にサーバルームへ入って
「さぁ、作業しようか」と思った矢先に、複数のUPSからアラームが。
「え?え?なんか電源落ちたっぽいんだけど・・・」と思っていたら
お客さんが入ってきて「通信できなくなったんだけど、なんかした?」と聞かれたので
「作業前なので、まだ手を付けてませんよ。電源系のアラームが出てますけど?」と
お話しして、お客さん離脱。しばらくすると復旧した。
その後話を聞いてみると、丁度落ちた時間に掃除機を回したとかどうとか。
掃除機回して落ちるサーバルームなの?、とも思ったが
電源・サーバ周りは他の業者がやっているので任せることにしましたとさ。
もっと物理的なお話をするとすれば・・・
NTT工事業者と一緒にテナントの回線撤去の立会に来た時のお話。
天井配線の撤去していたのですが、しばらくするとビル管理の人や
警備員がワラワラと登場。
何事かと思ったら、ビル火災報知器が作動したとのこと。
原因は、天井の点検口近くに設置してあった火災検知集積装置に
NTT工事の人が誤って触ったことによる誤検知だった。
天井裏の配線ルート近くに火災報知器なんて知らんよ、と思うのだが
鳴ってしまったものは仕方ないので、上長と顧客に連絡後
「NTTさん、後で報告書ね」と言っておいた。
そんなこんなで、私もまぁ色々と事例はもっております(笑
大切なのは「1に確認、2に確認」でござる。よく忘れるけど・・・
後処理が大変なので、ばかばかしい障害はなるべく減らしたいですね。