uutiset

Googlen tekoälyn sää"taikalaskenta" lanseerataan Naturessa: 30 sekuntia simuloi 22 päivän säätä, ja tehokkuus kasvaa 100 000 kertaa!

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Uusi viisausraportti

Toimittaja: Toimitusosasto

[Johdatus uuteen viisauteen] Google on ehdottanut uutta ML-pohjaista ilmakehän kiertomallia NeuralGCM, joka säästää useita suuruusluokkia laskelmissa perinteisiin fysiikkapohjaisiin malleihin verrattuna ja alentaa laskentakustannuksia 100 000 kertaa, mikä vastaa 25 vuoden kehitystä korkean teknologian alalla. suorituskyvyn laskeminen. 2-15 päivän sääennusteissa tämä menetelmä on tarkempi kuin SOTA-fyysinen malli.

Varhain tänä aamuna Googlen toimitusjohtaja Pichai julkaisi X:lle viestin, jossa hän ilmoitti, että NeuralGCM on tehnyt suuren läpimurron ilmastomallinnuksen alalla!

"NeuralGCM yhdistää fysiikkaan perustuvan mallinnuksen tekoälyyn simuloidakseen ilmakehää 100 000 kertaa tehokkaammin kuin muut mallit, tarjoten tutkijoille uusia työkaluja ilmastonmuutoksen ennustamiseen."


Tämä tutkimustulos on julkaistu myös Naturessa. Suurin osa tutkimustiimistä on peräisin Google Researchista ja DeepMindistä sekä MIT:n, Harvardin ja ECMWF:n tutkijoista.


Paperin osoite: https://www.nature.com/articles/s41586-024-07744-y

Googlen kehittämä malli, nimeltään NeuralGCM, voi simuloida nopeasti, tehokkaasti ja tarkasti Maan ilmakehän.

Sen merkitys on auttaa tutkijoita tekemään tarkkoja ennusteita maapallon ilmastosta aikana, jolloin maa lämpenee ennennäkemättömällä nopeudella.

Mitkä alueet kohtaavat pitkittyneen kuivuuden, kun maapallon lämpötila nousee? Missä rannikon tulvat ovat yleisempiä suurten trooppisten myrskyjen vuoksi? Miten metsäpalokausi muuttuu lämpötilan noustessa?

Näiden kiireellisten ongelmien edessä perinteinen fysiikkaan perustuva yleinen kiertomalli (GCM) näyttää olevan jonkin verran venynyt, kun se kohtaa pitkän aikavälin sää- ja ilmastosimulaatiot.

NeuralGCM on koneoppimiseen perustuva menetelmä, joka yhdistää perinteisen fyysisen mallinnuksen parantaakseen huomattavasti simuloinnin tarkkuutta ja tehokkuutta.

Tämä menetelmä tuottaa 2-15 päivän sääennusteita, jotka ovat tarkempia kuin nykyiset huipputekniikan mallit ja toistavat lämpötilat viimeisten 40 vuoden ajalta tarkemmin kuin perinteiset ilmakehän mallit.

Se on tärkeä askel kohti tehokkaampien ja helpompikäyttöisten ilmastomallien kehittämistä.


NeuralGCM simuloi erityistä kosteuden muutosmallia 26. joulukuuta 2019 ja 8. tammikuuta 2020 välisenä aikana

NeuralGCM muuttaa ilmastomallinnuksen

Vaikka tavanomaiset ilmastomallit ovat parantuneet viime vuosikymmeninä, ne kärsivät usein virheistä ja harhoista, jotka johtuvat tutkijoiden epätäydellisestä ymmärryksestä siitä, miten maapallon ilmasto toimii ja miten mallit rakennetaan.

Nämä mallit jakavat tilan pinnasta ilmakehään kuutioiksi, joiden sivut ovat 50-100 kilometriä, ja sitten ennustavat sään muutoksia kussakin kuutiossa tietyn ajanjakson aikana.

Malli laskee sitten ilman ja kosteuden liikkeet yleisesti hyväksyttyjen fysikaalisten lakien perusteella, jotka ovat sään ennustamisen perusta.

Mutta ongelmana on, että 50-100 kilometrin mittakaava on todella liian suuri.

Monet tärkeät ilmastoprosessit, mukaan lukien pilvet ja sademäärä, vaihtelevat pienemmissä mittakaavaissa kuin nykyisissä malleissa käytetyt kuutiokot (millimetreistä kilometreihin).

Lisäksi tiedemiesten fyysinen ymmärrys joistakin prosesseista, kuten pilvien muodostumisesta, on puutteellinen.

Tämän seurauksena nämä perinteiset mallit eivät tukeudu pelkästään perusperiaatteisiin, vaan käyttävät myös yksinkertaistettuja malleja luodakseen likiarvoja, joita kutsutaan "parametrisoiksi" pienimuotoisten ja huonosti ymmärrettyjen prosessien simuloimiseksi.

Nämä yksinkertaistetut approksimaatiot heikentävät väistämättä fyysisesti perustuvien ilmastomallien tarkkuutta.

Joten kuinka NeuralGCM ratkaisee tämän ongelman?

Perinteisten mallien tapaan NeuralGCM jakaa edelleen Maan ilmakehän kuutioiksi ja laskee suurten prosessien, kuten ilman ja veden liikkeen, fysiikan.

Erona on, että NeuralGCM ei enää luota "parametrisiin" likiarvoihin, jotka tutkijat ovat kehittäneet simuloidakseen pienimuotoisia säämuutoksia, vaan käyttää hermoverkkoja oppiakseen näiden tapahtumien fyysiset periaatteet olemassa olevista säätiedoista.

NeuralGCM:n keskeinen innovaatio on se, että suurten prosessien numeerinen ratkaisija on kirjoitettu alusta alkaen JAXissa.

Tämä antaa tutkijoille mahdollisuuden käyttää gradienttipohjaista optimointia säätääkseen kytkettyjen järjestelmien "online" käyttäytymistä useiden aikavaiheiden aikana.

Sitä vastoin aiemmat yritykset käyttää koneoppimista ilmastomallien parantamiseen ovat kohdanneet merkittäviä vaikeuksia numeerisen vakauden suhteen, koska niissä käytetään "offline-koulutusta", joka jättää huomioimatta ajan mittaan kertyvät erot pienimuotoisten ja suurten prosessien välillä.

Toinen etu koko mallin kirjoittamisesta JAX:iin on, että se toimii tehokkaasti TPU:illa ja GPU:illa, kun taas perinteiset ilmastomallit toimivat enimmäkseen CPU:illa.


NeuralGCM yhdistää perinteiset nestedynamiikan ratkaisijat hermoverkkoihin pienimuotoista fysiikkaa varten. Nämä komponentit yhdistetään differentiaaliyhtälön ratkaisijan avulla järjestelmän edistämiseksi kronologisesti.

Google-tiimi käytti ECMWF-säätietoja vuosilta 1979–2019 kouluttaakseen sarjan NeuralGCM-malleja 0,7°, 1,4° ja 2,8° resoluutioilla.

Vaikka NeuralGCM on koulutettu sääennustetietojen perusteella, tiimi suunnitteli NeuralGCM:n yleiseksi ilmakehän malliksi.

Tarkat sääennusteet ja ilmastoennusteet

Viimeaikaiset koneoppimismallit (ML) maapallon ilmakehästä, mukaan lukien Google DeepMindin GraphCast, ovat osoittaneet vallankumouksellisen tarkkuuden sääennusteissa.

Tähän mennessä ML-ennusteiden tutkimus on keskittynyt pääasiassa lyhyen aikavälin ennusteisiin, mikä on kaukana ilmastoennusteiden vaatimista vuosista vuosikymmeniin.

Koska usean vuosikymmenen ilmastoennusteita on vaikea varmistaa luotettavasti, Google-tiimi arvioi NeuralGCM:n suorituskyvyn ilmasto-asteikon ennusteissa ja säämallina vakiintuneen WeatherBench 2 -benchmarkin avulla.

NeuralGCM:n deterministinen malli 0,7°:n resoluutiolla on verrattavissa nykyaikaisiin huippumalleihin sääennusteen tarkkuuden suhteen ja sääennusteen tarkkuus voi olla jopa 5 päivää.

Deterministisista malleista puuttuu kuitenkin kvantitatiivinen epävarmuus, jota tarvitaan hyödyllisten ennusteiden tekemiseen pitkien läpimenoaikojen aikana.

Ennusteryhmät luodaan hieman erilaisista lähtöolosuhteista, jotta saadaan aikaan erilaisia ​​yhtä todennäköisiä sääolosuhteita. Nämä yhdistelmät tuottavat todennäköisyysennusteita, jotka ovat yleensä tarkempia kuin deterministiset ennusteet.

NeuralGCM:n ensemble-malli 1,4°:n resoluutiolla ylittää edellisen SOTA:n ennustetarkkuuden suhteen 5–15 päivää.

Tämä suorituskyvyn parannus johtuu siitä, että NeuralGCM tuottaa kokonaissääennusteita, jotka ovat verrattavissa ECMWF:n fysiikkapohjaiseen SOTA-malliin ECMWF-ENS.

Julkaistuista ML-malleista NeuralGCM on ensimmäinen, joka tekee tämän.

NeuralGCM:n kokonaisennusteet ovat tarkempia kuin ECMWF-ENS 95 % ajasta ennusteista, jotka vaihtelevat välillä 2–15 päivää.

NeuralGCM ylittää myös huippuluokan ilmakehän mallit ilmaston aika-asteikon ennusteissa.

Koska NeuralGCM simuloi vain maapallon ilmaston ilmakehän komponenttia, Google-tiimi vertasi sen suorituskykyä fysiikkaan perustuviin ilmakehän malleihin.

Kun ennustetaan lämpötiloja vuosien 1980 ja 2020 välillä, NeuralGCM:n 2,8° deterministisen mallin keskimääräinen virhe on kolmasosa ilmakehän mallin (AMIP) virheestä eli 0,25 vs. 0,75 celsiusastetta.


Vertaamalla NeuralGCM:n ja AMIP:n suorituskykyä 1000 hPa:n globaalin keskilämpötilan ennustamisessa vuosina 1980–2020

Koska perinteisillä ilmakehämalleilla on vaikeuksia simuloida tiettyjä Maan ilmakehän näkökohtia, ilmastotutkijat käyttävät joskus korkeamman resoluution malleja, kuten X-SHiELD, jotka ovat tarkempia, mutta ovat laskennallisesti kalliimpia.

X-SHiELD:hen verrattuna NeuralGCM:n 1,4° deterministinen malli vähensi virheitä 15–50 % ennustettaessa vuoden 2020 kosteus- ja lämpötilatietoja, jotka National Oceanic and Atmospheric Administration (NOAA) on toimittanut.

Vuoden 2020 ilmastosimulaatiossa NeuralGCM ennusti myös trooppisia syklonikuvioita, jotka vastasivat samalla alueella samana vuonna havaittujen myrskyjen määrää ja voimakkuutta.

NeuralGCM on ensimmäinen koneoppimiseen perustuva malli, joka pystyy luomaan tällaisia ​​​​malleja.


NeuralGCM ennustaa trooppisten myrskyjäljet ​​maailmanlaajuisesti vuonna 2020 (ennustetut myrskymäärät ja -intensiteetit vastaavat todellisia syklonien lukumäärää ja voimakkuutta, jotka on tallennettu ECMWF Reanalysis v5 (ERA5) -tietoaineistoon)

Avoin, nopea ja tehokas

NeuralGCM on suuruusluokkaa nopeampi laskentanopeudeltaan ja kustannuksiltaan kuin perinteiset fysiikkaan perustuvat ilmastomallit.

Sen 1,4° malli on yli 3 500 kertaa nopeampi kuin X-SHiELD, mikä tarkoittaa, että jos tutkijat simuloivat vuoden ilmakehää X-SHiELD:llä, se kestäisi 20 päivää, kun NeuralGCM:llä vain 8 minuuttia.

Lisäksi tiedemiehet tarvitsevat vain tietokoneen yhdellä TPU:lla (Tensor Processing Unit) NeuralGCM:n suorittamiseen, kun taas X-SHiELD:n käyttäminen vaatii 13 000 CPU:n (Central Processing Units) supertietokoneen käyttöä.

Kaiken kaikkiaan NeuralGCM:ää käyttävän ilmastosimuloinnin laskentakustannukset ovat 100 000 kertaa pienemmät kuin X-SHiELD:llä, mikä vastaa 25 vuoden kehitystä korkean suorituskyvyn laskennassa.

NeuralGCM simuloi ilmakehää nopeammin kuin huipputekniikan fyysiset mallit ja tuottaa samalla ennusteita samalla tarkkuudella

Tässä kaaviossa NeuralGCM kilpailee kahden fyysisen mallin, NCAR CAM ja NOAA X-SHiELD, kanssa vertaillakseen niiden ilmakehän simulaatiopäivien määrää 30 sekunnin laskentaajassa.

Kolme mallia toimivat eri resoluutioilla, X-SHiELD:llä on suurin resoluutio (0,03°), NCAR CAM6:lla on 1,0° ja NeuralGCM:llä pienin resoluutio (1,4°).

On syytä mainita, että vaikka NeuralGCM toimii alhaisella resoluutiolla, sen tarkkuus on verrattavissa korkearesoluutioisiin malleihin.

Sitten vertailukelpoisella tarkkuudella voidaan nähdä, että NeuralGCM voi tuottaa 22,8 päivän ilmakehän simulaation 30 sekunnissa, kun taas X-SHiELD, korkearesoluutioinen fyysinen malli, joka on ajettava supertietokoneessa, voidaan luoda vain 9 pöytäkirja!

Tämä eliminoi myös NCAR CAM6:n edut, jota tutkijat suosivat aiemmin alhaisten laskentakustannusten vuoksi.

Google-tiimi on paljastanut NeuralGCM:n lähdekoodin ja mallipainot GitHubissa ei-kaupallista käyttöä varten. He toivovat, että muut tutkijat voivat helposti lisätä uusia komponentteja hypoteesien testaamiseen ja mallin toimivuuden parantamiseen.

Lisäksi, koska NeuralGCM:ää voidaan käyttää kannettavalla tietokoneella eikä se vaadi supertietokoneen tukea, useammat ilmastotutkijat voivat käyttää tätä huippuluokan mallia työssään.

Päätelmät ja tulevaisuuden suunnat

NeuralGCM mallintaa tällä hetkellä vain maapallon ilmakehää, mutta Google-tiimi toivoo lopulta sisällyttävänsä malliin muita maapallon ilmastojärjestelmän näkökohtia, kuten valtameret ja hiilen kiertokulkua.

Tällä tavalla NeuralGCM pystyy tekemään ennusteita pidemmällä aikaskaalalla, ei vain ennustamaan säätä päivien ja viikkojen aikana, vaan myös ilmaston aika-asteikoilla.

Kaiken kaikkiaan NeuralGCM ehdottaa uutta tapaa rakentaa ilmastomalleja, jotka voivat olla nopeampia, vähemmän laskennallisesti kalliita ja tarkempia kuin nykyiset mallit.

Viitteet:

https://www.nature.com/articles/s41586-024-07744-y

https://research.google/blog/fast-accurate-climate-modeling-with-neuralgcm/

https://x.com/sundarpichai/status/1815512751793721649