소식

Google의 AI 날씨 '마법 계산'이 Nature에 출시되었습니다. 30초 동안 22일간의 날씨를 시뮬레이션하면 효율성이 100,000배 향상됩니다!

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


새로운 지혜 보고서

편집자: 편집부

[새로운 지혜 소개] Google은 새로운 ML 기반 대기 순환 모델인 NeuralGCM을 제안했습니다. 이 모델은 기존 물리학 기반 모델에 비해 몇 배나 많은 계산량을 절약하고 계산 비용을 100,000배 절감합니다. 이는 첨단 분야에서 25년간의 발전에 해당합니다. 성능 컴퓨팅. 2~15일 일기 예보의 경우 이 방법은 SOTA 물리적 모델보다 더 정확합니다.

오늘 아침 일찍 Google CEO Pichai는 X에 NeuralGCM이 기후 모델링 분야에서 획기적인 발전을 이루었다고 알리는 게시물을 올렸습니다!

"NeuralGCM은 물리 기반 모델링과 인공 지능을 결합하여 다른 모델보다 100,000배 더 효율적으로 대기를 시뮬레이션하여 과학자들에게 기후 변화를 예측할 수 있는 새로운 도구를 제공합니다."


이번 연구 결과는 네이처(Nature)에도 게재됐다. 연구팀의 대부분은 구글리서치(Google Research)와 딥마인드(DeepMind) 출신이며 MIT, 하버드, ECMWF 출신이다.


논문 주소: https://www.nature.com/articles/s41586-024-07744-y

NeuralGCM이라고 불리는 Google이 개발한 모델은 지구 대기를 빠르고 효율적이며 정확하게 시뮬레이션할 수 있습니다.

그 의의는 지구가 전례 없는 속도로 온난화되고 있는 상황에서 과학자들이 지구의 기후에 대해 정확한 예측을 할 수 있도록 돕는 것입니다.

지구 온도가 상승하면 어느 지역이 장기간의 가뭄에 직면하게 될까요? 주요 열대성 폭풍으로 인해 해안 홍수가 더 자주 발생하는 곳은 어디입니까? 기온이 상승하면 산불 시즌이 어떻게 변할까요?

해결해야 할 긴급한 문제에 직면했을 때 전통적인 물리학 기반의 일반 순환 모델(GCM)은 장기적인 기상 및 기후 시뮬레이션에 직면했을 때 안정성이 부족한 것으로 보입니다.

NeuralGCM은 전통적인 물리적 모델링을 결합하여 시뮬레이션의 정확성과 효율성을 크게 향상시키는 기계 학습 기반 방법입니다.

이 접근 방식은 현재의 최첨단 물리적 모델보다 더 정확한 2~15일 일기 예보를 생성하고 기존 대기 모델보다 지난 40년 동안의 온도를 더 정확하게 재현합니다.

이는 더욱 강력하고 사용하기 쉬운 기후 모델을 개발하는 데 중요한 단계입니다.


NeuralGCM은 2019년 12월 26일부터 2020년 1월 8일까지 비습도 변화 패턴을 시뮬레이션했습니다.

NeuralGCM은 기후 모델링을 혁신합니다

전통적인 기후 모델은 지난 수십 년 동안 개선되었지만 지구의 기후가 어떻게 작동하고 모델이 구성되는지에 대한 과학자의 불완전한 이해로 인해 종종 오류와 편견으로 어려움을 겪습니다.

이 모델은 표면에서 대기까지의 공간을 변이 50~100km인 큐브로 나눈 다음 일정 기간 동안 각 큐브의 날씨 변화를 예측합니다.

그런 다음 모델은 일기 예보의 기초가 되는 일반적으로 인정되는 물리 법칙을 기반으로 공기와 습기의 이동을 계산합니다.

그런데 문제는 50~100km라는 규모가 정말 너무 크다는 점이다.

구름과 강수량을 포함한 많은 중요한 기후 과정은 현재 모델에서 사용되는 입방체 크기(밀리미터에서 킬로미터)보다 작은 규모로 다양합니다.

더욱이, 구름 형성과 같은 일부 과정에 대한 과학자들의 물리적 이해는 불완전합니다.

결과적으로 이러한 기존 모델은 기본 원리에 의존할 뿐만 아니라 단순화된 모델을 사용하여 소규모 및 잘 이해되지 않은 프로세스를 시뮬레이션하기 위해 "매개변수화"라는 근사치를 생성합니다.

이러한 단순화된 근사치는 필연적으로 물리적 기반 기후 모델의 정확성을 감소시킵니다.

그렇다면 NeuralGCM은 이 문제를 어떻게 해결합니까?

기존 모델과 마찬가지로 NeuralGCM은 여전히 ​​지구 대기를 큐브로 나누고 공기 및 물 이동과 같은 대규모 프로세스의 물리학을 계산합니다.

차이점은 NeuralGCM은 소규모 날씨 변화를 시뮬레이션하기 위해 과학자들이 개발한 "파라메트릭" 근사치에 더 이상 의존하지 않고 신경망을 사용하여 기존 날씨 데이터에서 이러한 사건의 물리적 원리를 학습한다는 것입니다.

NeuralGCM의 주요 혁신은 대규모 프로세스를 위한 수치 솔버가 JAX에서 처음부터 다시 작성되었다는 것입니다.

이를 통해 연구자는 경사 기반 최적화를 사용하여 여러 시간 단계에 걸쳐 결합 시스템의 "온라인" 동작을 조정할 수 있습니다.

대조적으로, 기후 모델을 향상시키기 위해 기계 학습을 사용하려는 이전의 노력은 시간이 지남에 따라 축적되는 소규모 프로세스와 대규모 프로세스 간의 차이를 무시하는 "오프라인" 교육을 사용하기 때문에 수치 안정성에 상당한 어려움을 겪었습니다.

JAX로 전체 모델을 작성하는 또 다른 이점은 기존 기후 모델이 대부분 CPU에서 실행되는 반면 TPU 및 GPU에서 효율적으로 실행된다는 것입니다.


NeuralGCM은 소규모 물리학을 위한 전통적인 유체 역학 솔버와 신경망을 결합하여 시스템을 시간순으로 발전시키기 위해 미분 방정식 솔버를 통해 결합합니다.

Google 팀은 1979년부터 2019년까지의 ECMWF 기상 데이터를 사용하여 0.7°, 1.4° 및 2.8° 해상도에서 일련의 NeuralGCM 모델을 교육했습니다.

NeuralGCM은 일기 예보 데이터를 기반으로 훈련되었지만 팀은 NeuralGCM을 일반 대기 모델로 설계했습니다.

정확한 일기예보 및 기후 예측

Google DeepMind의 GraphCast를 포함한 지구 대기의 최신 기계 학습(ML) 모델은 날씨 예측에서 혁명적인 정확성을 보여주었습니다.

지금까지 ML 예측에 대한 연구는 기후 예측에 필요한 수년에서 수십 년에 이르는 단기 예측에 주로 집중되어 왔습니다.

수십 년 간의 기후 예측은 안정적으로 검증하기 어렵기 때문에 Google 팀은 확립된 WeatherBench 2 벤치마크를 사용하여 기후 규모 예측 및 날씨 모델로서 NeuralGCM의 성능을 평가했습니다.

NeuralGCM의 0.7° 해상도 결정론적 모델은 일기 예보 정확도 측면에서 현재의 최첨단 모델과 비슷하며 일기 예보 정확도는 5일에 도달할 수 있습니다.

그러나 결정론적 모델에는 긴 리드 타임에 걸쳐 유용한 예측을 하는 데 필요한 정량적 불확실성이 부족합니다.

예측 앙상블은 동일한 가능성의 기상 조건 범위를 생성하기 위해 약간 다른 시작 조건에서 생성됩니다. 이러한 앙상블은 일반적으로 결정론적 예측보다 더 정확한 확률론적 일기예보를 생성합니다.

1.4° 해상도의 NeuralGCM 앙상블 모델은 5~15일의 예측 정확도 측면에서 이전 SOTA보다 성능이 뛰어납니다.

이러한 성능 향상은 NeuralGCM이 ECMWF의 물리학 기반 SOTA 모델 ECMWF-ENS와 비교할 수 있는 앙상블 날씨 예측을 생성한다는 사실에 기인합니다.

게시된 ML 모델 중에서 NeuralGCM이 이 작업을 수행한 첫 번째 모델입니다.

NeuralGCM의 앙상블 예측은 2~15일 범위의 예측에서 ECMWF-ENS보다 95% 더 정확합니다.

NeuralGCM은 또한 기후 시간 규모 예측에서 최첨단 대기 모델보다 성능이 뛰어납니다.

NeuralGCM은 지구 기후의 대기 구성 요소만 시뮬레이션하기 때문에 Google 팀은 그 성능을 물리학 기반 대기 모델과 비교했습니다.

1980년에서 2020년 사이의 기온을 예측할 때 NeuralGCM의 2.8° 결정론적 모델의 평균 오류는 대기 모델(AMIP) 오류의 1/3, 즉 섭씨 0.25도와 0.75도입니다.


1980년부터 2020년까지 1000hPa 지구 평균 기온을 예측하는 데 있어 NeuralGCM과 AMIP의 성능 비교

전통적인 대기 모델은 지구 대기의 특정 측면을 시뮬레이션하는 데 어려움이 있기 때문에 기후 과학자들은 때때로 더 정확하지만 계산 비용이 더 많이 드는 X-SHIELD와 같은 고해상도 모델을 사용합니다.

X-SHIELD와 비교하여 NeuralGCM의 1.4° 결정론적 모델은 미국 국립해양대기청(NOAA)에서 제공한 2020년 습도 및 온도 데이터 예측에서 15~50% 더 적은 오류를 달성했습니다.

NeuralGCM은 2020년 기후 시뮬레이션에서 그 해 같은 지역에서 관찰된 폭풍의 수와 강도와 일치하는 열대 저기압 패턴도 예측했습니다.

NeuralGCM은 이러한 패턴을 생성할 수 있는 최초의 기계 학습 기반 모델입니다.


NeuralGCM은 2020년 전 세계적으로 열대성 저기압 경로를 예측합니다(예측된 폭풍 수 및 강도는 ECMWF Reanalytic v5(ERA5) 데이터 세트에 기록된 실제 사이클론 수 및 강도와 일치함)

개방적이고 빠르며 효율적입니다.

NeuralGCM은 기존 물리학 기반 기후 모델보다 계산 속도와 비용이 훨씬 더 빠릅니다.

1.4° 모델은 X-SHIELD보다 3,500배 이상 빠릅니다. 즉, 연구원이 X-SHIELD로 1년 대기를 시뮬레이션하면 NeuralGCM의 경우 8분 밖에 걸리지 않지만 20일이 소요됩니다.

또한 과학자들은 NeuralGCM을 실행하기 위해 단일 TPU(Tensor Processor Unit)가 있는 컴퓨터만 있으면 되는 반면, X-SHIELD를 실행하려면 13,000개의 CPU(중앙 처리 장치) 슈퍼컴퓨터가 필요합니다.

전반적으로 NeuralGCM을 사용한 기후 시뮬레이션의 계산 비용은 X-SHIELD보다 100,000배 낮으며 이는 고성능 컴퓨팅의 25년 발전에 해당합니다.

NeuralGCM은 최첨단 물리적 모델보다 더 빠르게 대기를 시뮬레이션하는 동시에 동일한 정확도로 예측을 생성합니다.

이 차트에서 NeuralGCM은 30초의 계산 시간 동안 생성되는 대기 시뮬레이션 일수를 비교하면서 두 가지 물리적 모델 NCAR CAM 및 NOAA X-SHIELD와 경쟁합니다.

세 가지 모델은 서로 다른 해상도로 실행되며, X-SHIELD는 가장 높은 해상도(0.03°), NCAR CAM6은 1.0°, NeuralGCM은 가장 낮은 해상도(1.4°)를 갖습니다.

NeuralGCM은 저해상도에서 실행되지만 정확도는 고해상도 모델과 비슷하다는 점을 언급할 가치가 있습니다.

그러면 비슷한 정확도로 NeuralGCM은 30초 만에 22.8일의 대기 시뮬레이션을 생성할 수 있는 반면, X-SHIELD는 슈퍼컴퓨터에서 실행해야 하는 고해상도 물리적 모델로서 9일 동안만 생성할 수 있음을 알 수 있습니다. 분!

이는 또한 이전에 낮은 계산 비용으로 인해 연구자들이 선호했던 NCAR CAM6의 장점을 제거합니다.

Google 팀은 비상업적인 용도로 GitHub에 NeuralGCM의 소스 코드와 모델 가중치를 공개했습니다. 그들은 다른 연구자들이 새로운 구성요소를 쉽게 추가하여 가설을 테스트하고 모델 기능을 개선할 수 있기를 바랍니다.

또한 NeuralGCM은 노트북에서 실행될 수 있고 슈퍼컴퓨터의 지원이 필요하지 않기 때문에 더 많은 기후 연구자들이 이 최첨단 모델을 작업에 사용할 수 있습니다.

결론 및 향후 방향

NeuralGCM은 현재 지구 대기만 모델링하고 있지만, Google 팀은 궁극적으로 해양, 탄소 순환 등 지구 기후 시스템의 다른 측면도 모델에 통합할 수 있기를 바라고 있습니다.

이런 방식으로 NeuralGCM은 며칠, 몇 주 동안의 날씨를 예측할 뿐만 아니라 기후 시간 규모에 대해서도 예측할 수 있어 더 긴 시간 규모에 대한 예측을 할 수 있습니다.

전체적으로 NeuralGCM은 기존 모델보다 더 빠르고, 계산 비용이 덜 들고, 더 정확할 수 있는 기후 모델을 구축하는 새로운 방법을 제안합니다.

참고자료:

https://www.nature.com/articles/s41586-024-07744-y

https://research.google/blog/fast-accurate-climate-modeling-with-neuralgcm/

https://x.com/sundarpichai/status/1815512751793721649