En datamodell som kombinerer tradisjonell værvarslingsteknologi med maskinlæring har utkonkurrert andre kunstig intelligens (AI)-baserte verktøy Forutsi værscenarier og langsiktige klimatrender overskredet.

Verktøyet, utgitt 22. juli iNaturble beskrevet 1, er den første maskinlæringsmodellen som genererer nøyaktige ensembleværmeldinger – de som representerer en rekke scenarier. Utviklingen åpner døren for spådommer som er raskere og mindre energikrevende enn eksisterende verktøy og mer detaljerte enn tilnærminger basert utelukkende på AI.

"Tradisjonelle klimamodeller må kjøres på superdatamaskiner. Dette er en modell du kan kjøre på få minutter," sier studiemedforfatter Stephan Hoyer, som studerer dyp læring ved Google Research i Mountain View, California.

Nåværende prognosesystemer er vanligvis avhengige av generelle sirkulasjonsmodeller (GCM), programmer som er avhengige av fysikkens lover for å simulere prosesser i jordens hav og atmosfære og forutsi hvordan de kan påvirke vær og klima. GCM-er krever imidlertid mye datakraft, og fremskritt innen maskinlæring tilbyr et mer effektivt alternativ. "Vi har terabyte eller petabyte (en million ganger større enn en gigabyte) med historiske værdata," sier Hoyer. "Ved å lære av disse mønstrene kan vi bygge bedre modeller."

Det er allerede noen maskinlæringsprognosemodeller som Pangu-Weather, laget av teknologikonglomeratet Huawei med base i Shenzhen, Kina og GraphCast av DeepMind med hovedkontor i London. Disse modellene har lignende nøyaktighetsnivåer som typiske GCM-er for deterministisk prognose – en tilnærming som genererer en enkelt værmelding. GCM-er er imidlertid ikke like pålitelige for ensembleprognoser eller langsiktige klimaspådommer.

"Problemet med rene maskinlæringsmetoder er at du bare trener den på data den allerede har sett," sier Scott Hosking, som forsker på AI og miljødata ved institutter i London. "Klimaet endrer seg kontinuerlig, vi er på vei inn i det ukjente, så maskinlæringsmodellene våre må ekstrapolere inn i denne ukjente fremtiden. Ved å inkorporere fysikk i modellen kan vi sikre at modellene våre er fysisk begrenset og ikke kan gjøre noe urealistisk."

Hybrid modell

Hoyer og teamet hans utviklet og trente NeuralGCM, en modell som "kombinerer aspekter av en tradisjonell fysikkbasert atmosfærisk løsningsmetode med noen AI-komponenter," sier Hoyer. De brukte modellen til å lage kort- og langsiktige værmeldinger og klimaprognoser. For å evaluere nøyaktigheten til NeuralGCM, sammenlignet forskere spådommene sine med data fra den virkelige verden, så vel som utdataene fra andre modeller, inkludert GCM-er og de som kun er basert på maskinlæring.

Som nåværende maskinlæringsmodeller, kan NeuralGCM produsere nøyaktige kortsiktige, deterministiske værmeldinger – mellom én og tre dager i forveien – mens de bruker en brøkdel av energien som kreves av GCM. Imidlertid gjorde den langt færre feil enn andre maskinlæringsmodeller når den produserte langtidsprognoser utover syv dager. Faktisk var NeuralGCMs langsiktige prognoser lik prognosene til European Center for Medium-Range Weather Forecast (ECMWF-ENS) ensemblemodell, en GCM som er allment ansett som gullstandarden for værvarsling.

Teamet testet også hvor godt modellen kunne forutsi ulike værfenomener, for eksempel tropiske sykloner. De fant at mange av de rene maskinlæringsmodellene ga inkonsistente og unøyaktige spådommer sammenlignet med både NeuralGCM og ECMWF-ENS. Forskerne sammenlignet til og med NeuralGCM med høyoppløselige klimamodeller kjent som globale stormløsningsmodeller. NeuralGCM var i stand til å produsere mer realistiske tropiske syklontall og baner på kortere tid.

Evnen til å forutsi slike hendelser er "så viktig for å forbedre beslutningsferdigheter og beredskapsstrategier," sier Hosking.

Hoyer og hans kolleger ønsker å videreutvikle og tilpasse NeuralGCM. "Vi har jobbet med den atmosfæriske komponenten i å modellere jordsystemet... Det er kanskje den delen som har mest direkte innvirkning på hverdagsværet," sier Hoyer. Han legger til at teamet ønsker å inkludere flere aspekter av geovitenskap i fremtidige versjoner for å forbedre nøyaktigheten til modellen ytterligere.