ニュース

張忠林:なぜ「ブルースクリーン事件」は中国の民間航空業界に影響を与えなかったのでしょうか?

2024-07-21

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

[文/Observer.comコラムニスト、張忠林]

現地時間の 7 月 19 日、世界中の無数の従業員が突然、コンピューターの画面にブルー スクリーンが表示されるか、システム サーバーに接続できないことに気づきました。通常は非常に効果的な「再起動方法」も効果を失い、再起動後も依然として巨大なブルー スクリーンに直面する必要があります。

今回、マイクロソフトのブルースクリーンによるシステム麻痺は世界中に広がっているが、特に北米では深刻で、飛行機は運航停止、911ホットラインは通じない、ホテルも使えないなど、社会運営に深刻な影響を与えている。チェックインされ、病院は手術をキャンセルされ、店舗は営業できなくなりました。すべては、あまり知られていないサイバーセキュリティ会社である CrowdStrike から始まりました。

はっきり言って、今回の世界的な「ブルースクリーン事件」が起きた理由はそれほど驚くべきものではない。ネットワーク セキュリティとクラウド コンピューティング エンドポイント保護の分野における世界トップ企業の 1 つとして、多数の企業とクラウド サーバーが CrowdStrike の Falcon プラットフォームを使用し、Windows プラットフォーム上で実行されています。

このインシデントは、CrowdStrike の最新のソフトウェア アップデートと Windows プラットフォームの間の深刻な互換性問題によって引き起こされ、その結果、広範囲にわたる「死のブルー スクリーン」と「無限ループ」が発生しました。パソコンに限定されていればまだしも、問題のアップデートはクラウドサーバー(Microsoft独自のクラウドサービス「Azure」など)にも適用され、深刻な問題を引き起こしたため、「ブルースクリーン事件」は広範囲に影響を与えることになった。パブリックドメインとなり、航空業界が再び矢面に立たされている。

アメリカン航空の「ブルースクリーン」

各国の航空会社は採用している情報システムソリューションが異なるため、「ブルースクリーン事件」の影響も異なる。セルフサービスチェックインシステムは利用できずカウンターでのみ処理できるものと、利用できないものがある。搭乗券を使用する場合、印刷は手書きでのみ可能であり、場合によっては、チェックインから預け入れまでシステムがまったく使用できなくなり、機能が完全に失われます。

Microsoft Azure クラウド サービスと Windows システムをベースとした端末を使用する航空会社の情報システムは、最も大きな被害を受けている分野であり、クラウド サービス上で実行されている情報システム サーバーです。


その日、人々はついに、ブルー スクリーンに支配される恐怖と、Windows システムを前に無力である屈辱を思い出しました。

米国にあるという「地理的優位性」により、アメリカン航空は今回の「ブルースクリーン事件」の最も大きな被害を受けた地域となっており、米国の大手航空会社3社(デルタ航空、アメリカン航空、ユナイテッド航空)はいずれも被害を受けている。地上命令に基づき、FAA は航空管制官に対し、航空会社が現在通信の問題に直面していることをパイロットに通知するよう義務付けています。さらに、ジェットブルー航空、フロンティア航空、スピリット航空などの中小航空会社も深刻な影響を受けており、主要システムが利用できなくなり、多数の便が欠航となった。


システムクラッシュの影響で、7月19日に米国を飛行する航空便の数が前日に比べて大幅に減少したことがわかります。

今回の一連のブルースクリーン事件の主な被害者として、デルタ航空、アメリカン航空、ユナイテッド航空の多数の便が欠航となり、最も大きな影響を受けたのは米国最大の旅客数を誇るアトランタ空港であった。米国最大のハブ空港であり、デルタ航空の拠点空港である同航空は、今回の「ブルースクリーン事件」で500便以上が欠航となり、そのほとんどがデルタ航空の便だった。これに続いて、シカゴのオヘア空港では200便近くが欠航し、ニューヨークのラガーディア空港では3分の1の便が欠航となった。米国以外の欧州の空港でも運航に大きな影響が出ており、アムステルダム空港では発着便の40%が遅れ、ベルリン空港では3分の1の便が欠航となった。

興味深いことに、この一連の大規模システム障害は、航空貨物会社である UPS と FEDEX だけでなく、サウスウエスト航空とアラスカ航空にも影響を及ぼしませんでした。その背景にある理由は「ブラック ユーモア」と呼ぶことができます。

現在、サウスウエスト航空が使用している運航管理システムは1992年のWindows 3.1システムをベースにしており、乗務員配置システムは電話による通話をベースとしています。したがって、今回の誤ったアップデートパッケージによるWindowsシステムやクラウドサービスの大規模なシステム停止は、サウスウエスト航空にとって実際のところ「システムが後進的すぎるため、影響はない」ことを意味する。

UPS と FEDEX も同様の状況にあり、主要なオペレーティング システムを実行するために依然として Windows 95 または Windows 3.1 を使用しているため、この惨事から逃れることができています。

影響を受けていない他の米国の航空会社のほとんどは地域航空会社で、これらの小規模航空会社は比較的原始的な情報とオペレーティング システムを備えており、高価なクラウド サービスを利用する余裕がないため、危機を逃れて通常通り運航できています。 2022年のクリスマスの日に北米で猛吹雪の影響で広範囲に遅延が発生したことを思い出させるが、米国南西部ではシステムが遅れていたため運航を再開できなかった。この事件は「運命の転換」と見なすことができ、それが証明されたといえる。 「成熟したシステム」の能力 「高い安定性」の利点。


32年前のWindowsシステムのせいで南西部ではYahooニュースの配信ができなくなっている

緊急対応が欠けている

今回のアップデートで大規模なシステム障害を引き起こした「ブルースクリーン事件」の中で、最も衝撃的だったのは、システム障害発生後、米国の大手航空会社3社があっさりと白旗を上げて全便を運航停止にしたことだ。これらの運航管理システムは、航空会社自体の日常の運航管理に関わるだけでなく、国の基幹交通システムの一部でもある重要なシステムであるため、これは間違いなく非常に驚くべきことであると私は考えています。

このような航空運用および制御システムは、航空運用が崩壊によって重大な影響を受けないようにするため、その信頼性と堅牢性に対して非常に高い要件が求められることがよくあります。国際民間航空機関 (ICAO) は、単一システムの崩壊によって引き起こされる重大な結果を回避するために、航空運用および制御システムのバックアップと冗長性に関する具体的な要件を一連の文書で提示しています。これには以下が含まれます。

重要な運用データを定期的にバックアップする必要があります。 冗長性は、バックアップ サーバー、ストレージ デバイスなどを含むハードウェアとソフトウェアに実装する必要があります。 さまざまな壊滅的なシナリオをカバーするには、詳細な災害復旧計画を作成する必要があります。 主要システム (航空管制システムなど) には、メイン システムに障害が発生した場合にすぐにバックアップ モード動作に切り替えることができる、自動フェイルオーバー機能と同期された動作データが必要です。

この「ブルー スクリーン インシデント」を見ると、これらの米国の航空会社が災害復旧計画を持っていなかった (または実装できなかった) ことも、重大なシステム障害後のバックアップへの自動切り替えも実装していなかったことがわかります。もちろん、バックアップがある可能性もありますが、そのバックアップでもブルー スクリーンが発生し (たとえば、Windows システムでも実行されており、誤ったアップデートの影響を受けた)、人々は「」と感じます。すべての卵を 1 つのカゴに入れることを避けるために、彼らは雷雨を防ぐために複数の P2P 財務管理を購入しました。」

現場での経験が豊富な者として、私も今回の米国の対応者のパフォーマンスには非常に困惑しています。なぜなら、航空会社はシステムの劣化や完全な稼働不能が発生した場合に最小限のレベルを確保するために、このような状況に備えた緊急時対応計画を立てている必要があるからです。最前線での仕事での私の経験に基づくと、航空機の積み込みは現在では情報システムを通じて行われていますが、積み込み担当者は依然として手作業で積み込みリストを作成する技術を持っています。積載システムが故障して使用できなくなった場合は、航空機のモデル番号に基づいて積載表の PDF ドキュメントを取り出し、積載表を印刷し、手動で積載量を計算して航空機の離陸データを取得します。この種の手動操作は、非常に基本的なビジネス スキルであり、手動計算が必要な重要な瞬間を見逃さないように、毎年、毎月、毎週練習されます。


手作業はこの業界の基本スキルです

他の関連リンクや部門も、緊急訓練に対してほとんど偏執的な要件を持っています。チェックイン部門と重複する部門であるため、チェックイン部門からはほぼ毎月、緊急訓練のためのバーチャルフライトを設定してほしいという電話がかかってきます。チェックイン緊急訓練の内容は、トラベルスカイシステム(中国で利用されている民間航空運行システム)がダウンした際に、乗客のチェックインや搭乗券をローカルモードで処理し、手書きの搭乗も行うというもの。印刷が不可能な場合、乗客は飛行機に搭乗することができます。

そのため、アメリカ人の同僚のチェックイン システム、積み込みシステム、その他多くのシステムが「ブルー スクリーン インシデント」によってクラッシュし、航空機の運航が完全に麻痺したのを見たとき、私は困惑しました。「あなたは普段手作業をやらないのですか」 ?緊急時の計画はありませんか?緊急時の計画を練っていませんか?バックアップ体制はないんですか?

なぜ中国は影響を受けないのか

世界に影響を与えたこの「ブルースクリーン事件」は中国にはほとんど影響を与えていないが、中国の民間航空便の運航は一部の外国航空会社(アメリカン航空やユナイテッド航空など)が遅れただけであり、その理由はそうではない。複雑。 。

まず、Windows システムを使用しており、CrowdStrike のセキュリティ ソフトウェアがインストールされている端末コンピュータの場合、エラー パッチを更新した後にのみ「ブルー スクリーン再起動」の問題が発生します。ただし、国内線の航空会社のコンピュータ端末では、同社のコンピュータ端末が使用されていないことがよくあります。セキュリティソフト。さらに、システムのアップデートについては慎重になることが多く、何も起こらなければアップデートを行わないことがほとんどです。使用される Windows のバージョンは主に、より成熟した安定したバージョンです。

第二に、ほとんどの国内航空会社は TravelSky システムを使用していますが、その動作環境は Linux ベースであり、Microsoft の Azure クラウド サービスや Amazon の AWS は使用していません。これにより、我が国の主要な基本的な民間航空システムの誤った更新によって引き起こされる完全な崩壊はある程度回避されました。

中国の民間航空の運航に関連する重要なシステムとして、トラベルスカイが運営するコンピューターシステムとネットワークは「重要な基本情報システム」であり、国務院が監督する8つの主要システムの1つとして挙げられている。春秋航空などの一部の航空会社を除き、他の航空会社はすべて TravelSky システムを使用しています。 TravelSky システムの安全性と安定性も大きな注目と州からの厳しい監督を受けており、システムの安定性と信頼性が保証されています。

もちろん、トラベルスカイのシステムに問題がないわけではありません。2020年8月25日、トラベルスカイの出国システムに異常が発生し、一部の空港でチェックインができなくなる事態が発生しました。報道によると、同日午前10時32分に異常が発生し、一部の空港でチェックインができなくなるなどしたが、午前11時7分に正常に戻ったという。多少の衝撃はありましたが、30分程度であったため大きな影響はなく、全体的にはスムーズに進みました。

TravelSky システムの何十年も変わっていないコマンド操作インターフェースは批判されていますが、重要な基幹情報システムでは安定した動作が最も重要です。完全に自律的な情報システムと運用環境に基づいて、私たちは「ブルースクリーン事件」の惨事に苦しむことも避けられ、アメリカのような大冗談も避けることができます。

この事件を通じて、私たちは重要な情報システムが重要なインフラとなっている現在、完全な自律性と制御性を実現することが極めて重要であることをより認識しました。これには情報システムだけでなく、オペレーティング システムも含まれます。ネットワークのセキュリティ状況がますます厳しくなるにつれ、その必要性は技術的な選択であるだけでなく、国家安全保障と産業発展にとっても戦略的な必要性であることに疑問の余地はありません。

この記事は Observer.com の独占原稿であり、記事の内容は純粋に著者の個人的な意見であり、プラットフォームの意見を表すものではありません。許可なく複製することはできません。そうしないと法的責任が追及されます。 WeChat guanchacn で Observer.com をフォローし、興味深い記事を毎日読んでください。