ニュース

GoogleのAI天気「魔法の計算」がNatureに登場:30秒で22日間の天気をシミュレーション、効率は10万倍に向上!

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


新しい知恵のレポート

編集者:編集部

【新しい知恵の紹介】 Google は、新しい ML ベースの大気循環モデル NeuralGCM を提案しました。これは、従来の物理ベースのモデルと比較して計算量を数桁節約し、計算コストを 100,000 分の 1 に削減します。これは、高エネルギー分野における 25 年間の進歩に相当します。パフォーマンスコンピューティング。 2 ~ 15 日間の天気予報の場合、この方法は SOTA 物理モデルよりも正確です。

今朝早く、Google CEO のピチャイが X に投稿し、NeuralGCM が気候モデリングの分野で大きな進歩を遂げたことを発表しました。

「NeuralGCM は物理ベースのモデリングと人工知能を組み合わせて、他のモデルより 10 万倍効率的に大気をシミュレートし、科学者に気候変動を予測するための新しいツールを提供します。」


この研究結果は、Nature にも掲載されています。研究チームのほとんどは Google Research と DeepMind の出身であり、MIT、ハーバード大学、ECMWF の科学者も参加しています。


論文アドレス: https://www.nature.com/articles/s41586-024-07744-y

Google が開発した NeuralGCM と呼ばれるモデルは、地球の大気を迅速、効率的かつ正確にシミュレートできます。

その重要性は、地球が前例のない速度で温暖化しているときに、科学者が地球の気候について正確に予測できるようにすることです。

地球の気温が上昇すると、どの地域が長期にわたる干ばつに直面するでしょうか?大規模な熱帯暴風雨による沿岸洪水がより頻繁に起こる地域はどこでしょうか?気温が上昇すると山火事の季節はどう変化するのでしょうか?

解決する必要があるこれらの緊急の問題に直面すると、従来の物理ベースの大循環モデル (GCM) は、長期にわたる気象および気候のシミュレーションに直面した場合、十分な安定性に欠けているように見えます。

NeuralGCM は、従来の物理モデリングを組み合わせてシミュレーションの精度と効率を大幅に向上させる機械学習ベースの手法です。

このアプローチは、現在の最先端の物理モデルよりも正確な 2 ~ 15 日間の天気予報を生成し、従来の大気モデルよりも正確に過去 40 年間の気温を再現します。

これは、より強力で使いやすい気候モデルの開発に向けた重要な一歩となります。


NeuralGCM は、2019 年 12 月 26 日から 2020 年 1 月 8 日までの比湿度変化パターンをシミュレートしました。

NeuralGCM は気候モデリングを変革します

従来の気候モデルは過去数十年にわたって改善されてきましたが、地球の気候がどのように機能し、モデルがどのように構築されるかについての科学者の理解が不完全であるために、誤差や偏見に悩まされることがよくあります。

これらのモデルは、地表から大気圏までの空間を一辺50~100キロメートルの立方体に分割し、各立方体における一定期間の天気の変化を予測する。

次にモデルは、天気予報の基礎となる、一般に受け入れられている物理法則に基づいて空気と水分の動きを計算します。

しかし問題は、50キロから100キロというスケールが本当に大きすぎることだ。

雲や降水量を含む多くの重要な気候プロセスは、現在のモデルで使用されている立方体サイズ (ミリメートルからキロメートル) よりも小さなスケールで変化します。

さらに、雲の形成などの一部のプロセスに関する科学者の物理的理解は不完全です。

その結果、これらの従来のモデルは基本原理に依存するだけでなく、小規模でよく理解されていないプロセスをシミュレートするために、単純化されたモデルを使用して「パラメータ化」と呼ばれる近似値を生成します。

これらの単純化された近似は、物理ベースの気候モデルの精度を必然的に低下させます。

では、NeuralGCM はこの問題をどのように解決するのでしょうか?

従来のモデルと同様に、NeuralGCM は依然として地球の大気を立方体に分割し、空気や水の動きなどの大規模プロセスの物理学を計算します。

違いは、NeuralGCM は小規模な気象変化をシミュレートするために科学者によって開発された「パラメトリック」近似に依存しなくなり、ニューラル ネットワークを使用して既存の気象データからこれらのイベントの物理的原理を学習することです。

NeuralGCM の主な革新は、大規模プロセス用の数値ソルバーが JAX で最初から書き直されたことです。

これにより、研究者は勾配ベースの最適化を使用して、複数の時間ステップにわたって結合システムの「オンライン」動作を調整できるようになります。

対照的に、機械学習を使用して気候モデルを強化するこれまでの取り組みは、時間の経過とともに蓄積される小規模プロセスと大規模プロセスの違いを無視する「オフライン」トレーニングを使用するため、数値安定性に関して大きな困難に直面していました。

モデル全体を JAX で記述することのもう 1 つの利点は、従来の気候モデルが主に CPU で実行されるのに対し、モデル全体が TPU と GPU で効率的に実行されることです。


NeuralGCM は、小規模物理学向けに従来の流体力学ソルバーとニューラル ネットワークを組み合わせたもので、微分方程式ソルバーを通じてシステムを時系列に進めます。

Google チームは、1979 年から 2019 年までの ECMWF 気象データを使用して、0.7°、1.4°、2.8° の解像度で一連の NeuralGCM モデルをトレーニングしました。

NeuralGCM は天気予報データに基づいてトレーニングされますが、チームは NeuralGCM を一般的な大気モデルとして設計しました。

正確な天気予報と気候予測

Google DeepMind の GraphCast を含む、地球大気の最近の機械学習 (ML) モデルは、天気予測における革命的な精度を実証しました。

これまで、ML 予測の研究は主に短期予測に焦点を当てており、気候予測に必要な数年から数十年には程遠いものでした。

数十年にわたる気候予測は確実に検証することが難しいため、Google チームは確立された WeatherBench 2 ベンチマークを使用して、気候スケールの予測および気象モデルとしての NeuralGCM のパフォーマンスを評価しました。

NeuralGCM の 0.7° 分解能の決定論的モデルは、天気予報精度の点で現在の最先端モデルに匹敵し、天気予報精度は 5 日に達します。

ただし、決定論的モデルには、長いリードタイムにわたって有用な予測を行うために必要な定量的不確実性が欠けています。

予測アンサンブルはわずかに異なる開始条件から生成され、同様に起こり得る気象条件の範囲を生成します。これらのアンサンブルは、一般に決定論的な予報よりも正確な確率論的な天気予報を生成します。

NeuralGCM の 1.4° 解像度のアンサンブル モデルは、5 ~ 15 日の予測精度の点で以前の SOTA を上回っています。

このパフォーマンスの向上は、NeuralGCM が ECMWF の物理ベースの SOTA モデル ECMWF-ENS に匹敵するアンサンブル天気予報を生成するという事実によるものです。

公開されている ML モデルの中で、これを行うのは NeuralGCM が最初です。

NeuralGCM のアンサンブル予測は、2 ~ 15 日の範囲の予測全体で 95% の確率で ECMWF-ENS よりも正確です。

NeuralGCM は、気候の時間スケールの予測においても最先端の大気モデルを上回ります。

NeuralGCM は地球の気候の大気成分のみをシミュレートするため、Google チームはそのパフォーマンスを物理ベースの大気モデルと比較しました。

1980 年から 2020 年の気温を予測する場合、NeuralGCM の 2.8° 決定論的モデルの平均誤差は、大気モデル (AMIP) の誤差の 3 分の 1、つまり摂氏 0.25 度対 0.75 度です。


1980 年から 2020 年の世界平均気温 1000 hPa を予測する際の NeuralGCM と AMIP のパフォーマンスの比較

従来の大気モデルでは地球の大気の特定の側面をシミュレートすることが難しいため、気候科学者は X-SHiELD などの高解像度モデルを使用することがあります。X-SHiELD は精度は高くなりますが、計算コストが高くなります。

X-SHiELD と比較して、NeuralGCM の 1.4° 決定論的モデルは、米国海洋大気庁 (NOAA) が提供する 2020 年の湿度と温度のデータを予測する際に、誤差が 15 ~ 50% 減少しました。

2020 年の気候シミュレーション中に、NeuralGCM は、その年に同じ地域で観測された嵐の数と強さと一致する熱帯低気圧のパターンも予測しました。

NeuralGCM は、そのようなパターンを生成できる最初の機械学習ベースのモデルです。


NeuralGCM は、2020 年の世界的な熱帯低気圧の進路を予測します (予測された暴風雨の数と強さは、ECMWF Reanalation v5 (ERA5) データセットに記録された実際の低気圧の数と強さと一致します)

オープン、高速、効率的

NeuralGCM は、従来の物理ベースの気候モデルよりも計算速度とコストが桁違いに高速です。

その 1.4° モデルは X-SHiELD よりも 3,500 倍以上高速です。つまり、研究者が X-SHiELD で 1 年間の大気をシミュレーションした場合、NeuralGCM ではわずか 8 分かかるのに対し、20 日かかることになります。

さらに、科学者は NeuralGCM を実行するために 1 つの TPU (Tensor Processing Unit) を搭載したコンピューターのみを必要としますが、X-SHiELD を実行するには 13,000 個の CPU (Central Processing Unit) スーパーコンピューターを使用する必要があります。

全体として、NeuralGCM を使用した気候シミュレーションの計算コストは​​ X-SHiELD の計算コストの 100,000 分の 1 であり、これはハイパフォーマンス コンピューティングの 25 年間の進歩に相当します。

NeuralGCM は、同じ精度で予測を生成しながら、最先端の物理モデルよりも高速に大気をシミュレートします。

このグラフでは、NeuralGCM が 2 つの物理モデル NCAR CAM および NOAA X-SHiELD と競合し、30 秒の計算時間で生成される大気シミュレーションの日数を比較しています。

3 つのモデルは異なる解像度で実行され、X-SHiELD の解像度が最高 (0.03°)、NCAR CAM6 の解像度が 1.0°、NeuralGCM の解像度が最低 (1.4°) です。

NeuralGCM は低解像度で実行されますが、その精度は高解像度モデルと同等であることに注意してください。

次に、同等の精度で、NeuralGCM は 22.8 日分の大気シミュレーションを 30 秒で生成できるのに対し、X-SHiELD はスーパーコンピューターで実行する必要がある高解像度の物理モデルとして、9 日分しか生成できないことがわかります。分!

これにより、計算コストが低いために以前は研究者に好まれていた NCAR CAM6 の利点も失われます。

Google チームは、NeuralGCM のソース コードとモデルの重みを GitHub 上で非営利目的で公開しました。彼らは、他の研究者が新しいコンポーネントを簡単に追加して仮説を検証し、モデルの機能を改善できることを望んでいます。

さらに、NeuralGCM はラップトップで実行でき、スーパーコンピューターのサポートを必要としないため、より多くの気候研究者がこの最先端のモデルを研究に使用できるようになります。

結論と今後の方向性

NeuralGCM は現在、地球の大気のみをモデル化していますが、Google チームは最終的には海洋や炭素循環など、地球の気候システムの他の側面をモデルに組み込むことを望んでいます。

このようにして、NeuralGCM はより長い時間スケールでの予測を行うことができるようになり、数日、数週間にわたる天気だけでなく、気候の時間スケールでも予測できるようになります。

全体として、NeuralGCM は、既存のモデルよりも高速で、計算コストが低く、より正確な気候モデルを構築する新しい方法を提案します。

参考文献:

https://www.nature.com/articles/s41586-024-07744-y

https://research.google/blog/fast-accurate-climate-modeling-with-neuralgcm/

https://x.com/sundarpichai/status/1815512751793721649