2014年10月15日水曜日

IT今昔物語 システムの安定稼働は神頼み?

大須賀です。

今回は息抜きで、昔私の関わった仕事についてお話ししようと思います。


もう30年も前の話になりますが、私は、新入社員の頃、NTT(当時の電電公社)の電話交換機関連の開発をしていました。

当時は毎日終電で帰り、たまに徹夜もあり、忙しかったですけど、結構楽しく仕事していた記憶があります。

電話交換機というのはコンピュータです。電話機と電話機を接続するためのクロスバというリレーをコンピュータで作動させ、物理的・電気的に直結させることで電話をつなぎます。デジタル交換機と言いますが技術としてはアナログです。IP電話のようにデジタル変換してデータで送るようなこともしていません。

このあたりは秘密に相当する内容ではありません。
NTTも(http://www.ntt-east.co.jp/business/magazine/nw_system/01/)に掲載しています。
ちなみに私の関わっていた交換機は「D70」ですが、呼び方は「ディーナナマル」じゃ素人です。業界人は「デーナナマル」と呼びますのでご注意ください。
            
電話というのは生活必需のインフラですので、サービス継続の責任があります。そのためマシンはハードウェアを2系統持った、完全二重化システムです。マシンがダウンすると、自動的にCPU、メモリ、ディスク等のハードウェアを組み替えて起動しますが、初期段階ではオンラインでメモリ等だけを切り替えます。それでも復旧しない場合、次々と系切り替えを行い、どうしてもダメな場合には完全初期状態からの再立ち上げになるのですが、その状態を「フェーズ2」と呼びます。

リリース直後ですからバグも残っていて「フェーズ2」がハード障害よりもソフト障害で起こることが多かったため、「フェーズ2発生」というと開発チームはみんな青くなったものです。また、電話交換機はサービス継続を最優先に設計されているため、電話がかかりすぎてCPU BUSYが一定時間続いた場合も再起動します。
最近はあまり聞きませんが、人気アーティストのコンサートチケット予約などで電話が殺到し「お客様のおかけになった電話は大変混みあってかかりにくくなっております」の状態になるときは、フェーズ2で再起動している場合もあるようですね。
特に我々は、フェーズ2が発生したときにだけ動くモジュールの担当だったので、チケット販売の情報にも気を使っていました。この日は誰それのチケット発売日なので、チケット事務所のある地区の交換機は要注意、とかです。

現在のWebシステムは、Webサーバーを複数台配置し、利用量に応じて増やしたりすることで、瞬間的なトラフィックの増大に対応します。
しかし、電話交換機の場合、物理的にリレーが接続されているため、同じような手法で対応ができないんですね。

さて、時代としてはPC-9801がVMかUVの頃ですから、マルチタスク32ビットの電話交換機は技術的にはかなり高度で高速なコンピュータで、自分たちとしては最先端の技術に関わっている自負がありました。

ところがある日のこと。私の先輩が現地調整に行ったところ、システムカットオーバー前にホンモノの神主さんが来て、マシンルームのラックの前で大麻(おおぬさ)を振ってお祈りをしたそうです。後ろには工事担当の人とか技術者がビシッと並んで・・・先輩も目が点になったと言っていました。
地鎮祭のようなノリなのでしょうか?
それとも「落ちないように」お祈りするのかな?

さすがに神様でもバグ回避はしてはくれないですからね。
デバッグが遅れてスケジュール進行が押してる原因だった我々としては、非常に複雑な気分でした。


0 件のコメント:

コメントを投稿