AI će uskoro preuzeti projekte za koje su ljudima potrebni tjedni

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Umjetna inteligencija brzo se poboljšava i uskoro bi mogla preuzeti projekte za čije dovršenje ljudima trebaju tjedni. Stručna analiza pokazuje da vodeći modeli umjetne inteligencije napreduju i da bi do 2029. mogli izvršiti zadatke uz pomoć ljudske ekspertize u kraćem vremenu.

Künstliche Intelligenz verbessert sich rasant und könnte bald Projekte übernehmen, für die Menschen Wochen benötigen. Expertenanalysen zeigen, dass führende KI-Modelle im Fortschritt sind und bis 2029 Aufgaben mit menschlicher Expertise in kürzerer Zeit bewältigen könnten.
Umjetna inteligencija brzo se poboljšava i uskoro bi mogla preuzeti projekte za čije dovršenje ljudima trebaju tjedni. Stručna analiza pokazuje da vodeći modeli umjetne inteligencije napreduju i da bi do 2029. mogli izvršiti zadatke uz pomoć ljudske ekspertize u kraćem vremenu.

AI će uskoro preuzeti projekte za koje su ljudima potrebni tjedni

Današnji sustavi umjetne inteligencije (AI) ne mogu nadmašiti ljude u dugim zadacima, ali se razvijaju brzo dalje i mogao bi smanjiti jaz brže nego što su mnogi očekivali, prema analizi vodećih modela 1.

Neprofitna organizacija METR sa sjedištem u Berkeleyju u Kaliforniji razvila je gotovo 170 zadataka iz stvarnog svijeta u programiranju, kibernetičkoj sigurnosti, općem razmišljanju i strojnom učenju, a zatim je uspostavila "ljudsku osnovu" mjereći vrijeme koje je stručnjacima trebalo da izvrše te zadatke.

Tim je zatim razvio metriku za procjenu napretka AI modeli, koji se naziva "vremenski horizont dovršetka zadatka". To je vrijeme koje je obično potrebno programerima da dovrše zadatke koje AI modeli mogu dovršiti s određenom stopom uspjeha.

U preprintu objavljenom ovog tjedna na arXiv-u, METR izvještava da GPT-2, rani model velikog jezika (LLM) koji je objavio OpenAI 2019., nije uspio u svim zadacima za koje je ljudskim stručnjacima trebalo više od minute. Claude 3.7 Sonnet, koji je u veljači objavio američki startup Anthropic, dovršio je 50% zadataka za koje bi ljudima trebalo 59 minuta.

Sveukupno, vremenski horizont 13 vodećih AI modela udvostručio se otprilike svakih sedam mjeseci od 2019., prema studiji. Eksponencijalni rast vremenskih horizonata umjetne inteligencije ubrzao se 2024., pri čemu najnoviji modeli udvostručuju svoj horizont otprilike svaka tri mjeseca. Rad još nije službeno pregledan.

Krećući se naprijed od 2019. do 2024., METR sugerira da će AI modeli moći dovršiti zadatke za koje je ljudima potrebno oko mjesec dana s 50% pouzdanosti do 2029., možda čak i ranije.

Jedan mjesec posvećene ljudske ekspertize, sugerira članak, može biti dovoljan za pokretanje nove tvrtke ili za znanstvena otkrića.

Međutim, Joshua Gans, profesor menadžmenta na Sveučilištu Toronto u Kanadi koji je pisao o ekonomiji umjetne inteligencije, objašnjava da takva predviđanja nisu posebno korisna. “Ekstrapolacije su primamljive, ali još uvijek postoji toliko toga što ne znamo o tome kako će se umjetna inteligencija zapravo koristiti da bi ova predviđanja imala smisla”, kaže.

Procjena ljudi u odnosu na AI

Tim je odabrao stopu uspješnosti od 50% jer je bila najotpornija na male promjene u distribuciji podataka. "Ako odaberete vrlo niske ili vrlo visoke pragove, dodavanje ili uklanjanje jednog uspješnog ili neuspješnog zadatka u skladu s tim uvelike mijenja procjenu", objašnjava koautor Lawrence Chan.

Povećanje pouzdanosti s 50% na 80% smanjilo je prosječni vremenski horizont za faktor pet - iako su ukupno vrijeme udvostručenja i linija trenda bili slični.

Tijekom posljednjih pet godina napravljena su poboljšanja opće vještine LLM-a potaknut prvenstveno povećanjem razmjera—količine podataka za obuku, vremena obuke i broja parametara modela. Rad pripisuje napredak u metrici vremenskog horizonta prvenstveno poboljšanjima u logičkom zaključivanju, korištenju alata, ispravljanju pogrešaka i pouzdanosti zadataka.

METR-ov pristup procjeni vremenskih horizonta bavi se nekim ograničenjima postojećih referentnih vrijednosti umjetne inteligencije, koja samo labavo odgovaraju radu u stvarnom svijetu i brzo postaju "zasićena" kako se modeli poboljšavaju. Omogućuje kontinuirano, intuitivno mjerenje koje bolje bilježi značajan napredak tijekom vremena, kaže koautor Ben West.

Vodeći AI modeli u mnogima postižu nadljudske performanse Benchmark testiranje, ali do sada su imali relativno mali ekonomski učinak, objašnjava West. Najnovije istraživanje METR-a nudi djelomičan odgovor na ovu zagonetku: najbolji modeli pokazuju vremenski okvir od oko 40 minuta, a nema mnogo ekonomski vrijednog posla koji osoba može obaviti u tom vremenu, rekao je West.

Međutim, Anton Troynikov, istraživač umjetne inteligencije i poduzetnik iz San Francisca, Kalifornija, objašnjava da bi umjetna inteligencija imala veći ekonomski učinak kada bi organizacije bile spremnije eksperimentirati i ulagati u učinkovito korištenje modela.

  1. Kwa, T. i sur. Pretisak na arXiv https://doi.org/10.48550/arXiv.2503.14499 (2025).

Preuzmite reference