Potem ko je Google DeepMind premagal ljudi v vsem, od Igrajte strateške družabne igre Go to,
zdaj trdi, da je na robu premagati najboljše učence na svetu pri reševanju matematičnih problemov.
S sedežem v Londonu Strojno učenje Podjetje je 25. julija objavilo, da so njegovi sistemi umetne inteligence (AI) rešili štiri od šestih problemov, ki so jih dobili učenci na mednarodni matematični olimpijadi (IMO) leta 2024 v Bathu v Združenem kraljestvu. Umetna inteligenca je zagotovila stroge dokaze po korakih, ki sta jih ocenila dva vrhunska matematika in dosegla rezultat 28/42 – le eno točko od območja zlate medalje.
»To je očitno zelo pomemben napredek,« pravi Joseph Myers, matematik iz Cambridgea v Združenem kraljestvu, ki je skupaj s Fieldsovim medalistom Timom Gowersom pregledal rešitve in pomagal izbrati izvirne probleme za letošnjo IMO.
DeepMind in druga podjetja tekmujejo, da bi strojem končno zagotovili dokaze, ki so pomembni Rešite raziskovalna vprašanja iz matematike. Težave, predstavljene na IMO, vodilnem svetovnem tekmovanju za mlade matematike, so postale merilo za napredek pri doseganju tega cilja in veljajo za "velik izziv" za strojno učenje, so sporočili iz podjetja.
"To je prvič, da je sistem umetne inteligence dosegel uspešnost na ravni medalj," je na novinarski konferenci dejal Pushmeet Kohli, podpredsednik oddelka za umetno inteligenco v znanosti pri DeepMind. "To je pomemben mejnik pri ustvarjanju naprednih preiskovalcev dokazov," je dejal Kohli.
Razširitev
Pred nekaj meseci, januarja, sistem DeepMind Dosežki na ravni medalj AlphaGeometry doseči pri reševanju ene vrste problemov IMO, in sicer tistih v evklidski geometriji. Prvi AI, ki bo dosegel zlato medaljo na celotnem testu – vključno z vprašanji iz algebre, kombinatorike in teorije števil, ki na splošno veljajo za zahtevnejše od geometrije – bo upravičen do nagrade v vrednosti 5 milijonov dolarjev, nagrade AI Mathematics Olympiad Prize (AIMO). (Nagrada ima stroga merila, kot sta razkritje izvorne kode in delo z omejeno računalniško močjo, kar pomeni, da se trenutna prizadevanja DeepMinda ne bi kvalificirala.)
V zadnjem poskusu so raziskovalci uporabili AlphaGeometry2 za rešitev geometrijskega problema v manj kot 20 sekundah; umetna inteligenca je izboljšana in hitrejša različica njihovega sistema zapisa, pravi računalniški strokovnjak DeepMind Thang Luong.
Za druge vrste vprašanj je ekipa razvila popolnoma nov sistem, imenovan AlphaProof. AlphaProof je reševal dve algebrski nalogi na tekmovanju in eno iz teorije števil, kar je trajalo tri dni. (Udeleženci dejanske IMO imajo dve seji po 4,5 ure.) Ni bilo mogoče rešiti dveh problemov v kombinatoriki, drugem področju matematike.

Raziskovalci so imeli mešane rezultate pri odgovarjanju na matematična vprašanja z uporabo jezikovnih modelov – sistemov, ki poganjajo chatbote, kot je ChatGPT. Včasih modeli dajo pravi odgovor, vendar ne morejo racionalno razložiti svojega razmišljanja, včasih pa trobijo neumnosti.
Ravno prejšnji teden je skupina raziskovalcev iz podjetij za programsko opremo Numina in HuggingFace uporabila jezikovni model, da bi osvojila vmesno nagrado za napredek AMIO, ki temelji na poenostavljenih različicah problemov IMO. Podjetja so svoje celotne sisteme naredila odprtokodnimi in jih dala na voljo drugim raziskovalcem za prenos. Toda zmagovalci so rekliNarava, da samo jezikovni modeli verjetno ne bi bili dovolj za reševanje zahtevnejših problemov.
Samo razred
AlphaProof združuje jezikovni model s tehnologijo za krepitev učenja, ki uporablja motor "AlphaZero", ki ga je podjetje uspešno uporabilo za napadalne igre, kot so Go in nekatere specifične matematične probleme rabljeno. Pri učenju z okrepitvijo se nevronska mreža uči s poskusi in napakami. To dobro deluje, če je mogoče njegove odgovore ovrednotiti z objektivnim standardom. V ta namen je bil AlphaProof usposobljen za branje in pisanje dokazov v formalnem jeziku, imenovanem Lean, ki se uporablja v istoimenskem programskem paketu 'Proof Assistant', priljubljenem med matematiki. Da bi to naredil, je AlphaProof preizkusil, ali so njegovi rezultati pravilni, tako da jih je zagnal v paketu Lean, kar je pomagalo izpolniti nekatere korake v kodi.
Usposabljanje jezikovnega modela zahteva ogromne količine podatkov, vendar je bilo v Leanu na voljo malo matematičnih dokazov. Da bi premagali to težavo, je skupina razvila dodatno omrežje, ki je poskušalo prevesti obstoječi zapis milijona problemov, napisanih v naravnem jeziku, vendar brez rešitev, ki bi jih napisal človek, v vitkost, pravi Thomas Hubert, raziskovalec strojnega učenja DeepMind, ki je sovodil razvoj AlphaProof. "Naš pristop je bil, ali se lahko naučimo dokazovati, tudi če se prvotno nismo urili na človeško napisanih dokazih?" (Podjetje je ubralo podoben pristop kot Go, kjer se je njegov AI naučil igrati igro tako, da je igral sam proti sebi in ne na način, kako to počnejo ljudje.)
Čarobni ključi
Številni prevodi Lean niso imeli smisla, vendar jih je bilo dovolj dobrih, da so AlphaProof pripeljali do točke, ko je lahko začel svoje cikle učenja okrepitve. Rezultati so bili veliko boljši od pričakovanih, je na novinarski konferenci povedal Gowers. "Številne težave v IMO imajo to lastnost čarobnega ključa. Težava je sprva videti težka, dokler ne najdete čarobnega ključa, ki jo odpre," je dejal Gowers, ki dela na Collège de France v Parizu.
V nekaterih primerih se je zdelo, da je AlphaProof sposoben zagotoviti ta dodaten korak ustvarjalnosti z zagotavljanjem enega pravilnega koraka iz neskončno velike možne rešitve. Toda potrebna je nadaljnja analiza, da bi ugotovili, ali so bili odgovori manj presenetljivi, kot se je zdelo, je dodal Gowers. Podoben diskurz se je pojavil po presenetljivem 'Vlak 37', bot DeepMinds AlphaGo pri njegovem slavna zmaga leta 2016 nad najboljšim človeškim igralcem goa na svetu narejeno – prelomnica za AI.
Ali je mogoče tehnike izpopolniti za delo na raziskovalni ravni v matematiki, bomo še videli, je dejal Myers na tiskovni konferenci. "Ali se lahko razširi na druge vrste matematike, ki morda nimajo milijonov urljenih problemov?"
"Smo na točki, ko lahko dokažejo ne le odprte raziskovalne probleme, ampak tudi probleme, ki so zelo zahtevni za najboljše mlade matematike na svetu," je dejal računalniški specialist DeepMind David Silver, ki je bil glavni raziskovalec pri razvoju AlphaGo sredi 2010-ih.
 
             
				  