FC2ブログ

Entries

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
この記事にトラックバックする(FC2ブログユーザー)
http://bemasterof.blog24.fc2.com/tb.php/226-b66f910d

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

システム障害 Again

また、起きてしまった。2年前に、ここで指摘した点、はたして今回は改善されたか。

システム障害と妥協

IT Proによれば、今回のあらましは以下だ。


R東日本によると、17日午前7時過ぎに新白河駅と福島駅でポイント故障が発生。駅と駅との間で列車が止まるのを防ぐため、24本の列車を各駅に停止させるようCOSMOSに指示を出した。この指示を受けて、COSMOSはダイヤ変更を計算するとともに、後続列車についてデータ変更が必要な箇所をチェックした。

 本来であれば、COSMOSはダイヤとデータ変更が必要な箇所を、東京の運行本部にあるパソコンに表示する(写真)。この表示に基づき、運行本部の司令員がデータを変更する。その変更指示を反映した形で、COSMOSがダイヤ変更を完了させる。

 ところが、17日はこのように作業を進めることができなかった。というのも、COSMOSは1分ごとにデータ変更が必要な箇所のチェック処理を起動しているが、変更が必要な箇所が600件を超えるとダイヤを表示できなくなる仕組みになっていた。この日は短時間に修正指示が集中した結果、変更が必要な箇所が600件を超えた。これにより、東京の運行本部にあるパソコン22台すべてでダイヤ画面の表示が消えた。



結論から言えば、2008年12月29日に発生したシステム障害とほぼ構造は同じにみえる。

そして、今回の場合は、降雪によるダイヤの乱れを手作業で修正したために、結果として、手作業が追いつかず、障害につながったと。

自分にも経験があるのでよくわかるのだが、この手の障害は、”喉元すぎれば熱さも忘れる”というやつで、発生してから1年くらい何も障害がないと忘れてしまう。

問題は、忘れて良いものと忘れていけないもの、があるということだ。自分しか使わないプログラムだったら、前者で全く問題はない、でも、何千万人もの人間が利用する社会インフラの場合、間違いなく後者だ。

そして、忘れないためにはどうすれば良いか、やはり、以前指摘したように、毎日毎日、あらゆる立場からレビューをするしかないだろう。”今度は大丈夫”とみんなが思うのが、一番危うい、それを違う立場からレビューすることで、前提が違っていたということはよくあることだ。

自分の予想としては、おそらく、今回の教訓をもとに、ダイヤを手で書き換えるというオペレーションはだいぶ減らさざるをえないだろう、だけど、それで完璧かといえば、やはり、予期せぬ自体は出てくるし、システム障害はなくならないだろう。だからこそ、継続的なレビューが求められていると思う。
この記事にトラックバックする(FC2ブログユーザー)
http://bemasterof.blog24.fc2.com/tb.php/226-b66f910d

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

Appendix

プロフィール

kengo

Author:kengo
コンセプト:
①ブラックボックスとしてのITを解きほぐす:どんどん便利になっていくIT、便利になる反面、ブラックボックスになっているもの事実。ブラックボックス化しつつあるITを解きほぐしていきます。

②エンジニアのためのファイナンス:ファイナンスは企業全体を見るツールとしてとても重要。企業そしてビジネス全体をどう見ていくか、そんな情報を提供します。

③映画・書評:IT・ビジネス系の書評、見た映画についてつづっていきます。

メールはこちらまで




Disclaimer
このBlogは長橋賢吾の個人的な考えを掲載したものであり、長橋賢吾が所属ないし関係する機関、組織、グループ等の意見を反映したものでありません。

MicroAd

FC2アフィリエイト

旅ポケドットコム

メールフォーム

名前:
メール:
件名:
本文:

アクセス解析

reviewplus

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。