Može li Google Scholar preživjeti AI revoluciju?
Google Scholar slavi 20 godina. S novim natjecanjem temeljenim na umjetnoj inteligenciji, pitanje je: Može li se održati?

Može li Google Scholar preživjeti AI revoluciju?
Google Scholar, najveća i najopsežnija akademska tražilica, ovaj tjedan slavi svoj 20. rođendan. Tijekom posljednja dva desetljeća neki su istraživači primijetili da je ovaj alat postao jedan od najvažnijih alata u znanosti. Međutim, posljednjih su se godina pojavili konkurenti koji koriste umjetnu inteligenciju (AI) za poboljšanje iskustva pretraživanja, kao i drugi koji korisnicima omogućuju preuzimanje njihovih podataka.
Utjecaj Google Scholara, kojeg vodi internetski div Google iz Mountain Viewa u Kaliforniji, je izvanredan, kaže Jevin West, računalni društveni znanstvenik sa Sveučilišta Washington u Seattleu koji svakodnevno koristi tu bazu podataka. Ali "ako je ikada postojao trenutak u kojem bi se Google Scholar mogao zamijeniti kao primarni pretraživač, to bi moglo biti sada, zbog nekih od ovih novih alata i inovacija koje se događaju drugdje", rekao je West.
Mnoge prednosti Google Scholara — besplatan pristup, širina informacija i sofisticirane opcije pretraživanja — "sada dijele i druge platforme", kaže Alberto Martín Martín, bibliometričar na Sveučilištu Granada u Španjolskoj.
Chatbotovi koje pokreće AI kao što je ChatGPT i drugi alati koji koriste velike jezične modele postali su preferirane aplikacije za neke istraživače prilikom pretraživanja, pregledavanja i sažimanja literature. Neki su istraživači zamijenili Google Scholar za ove alate. "Donedavno je Google Scholar bio moja zadana tražilica", kaže Aaron Tay, akademski knjižničar na Singapurskom sveučilištu za menadžment. I dalje je na vrhu njegove liste, ali "u zadnje vrijeme sam počeo koristiti druge AI alate."
Ipak, s obzirom na veličinu Google Scholara i koliko je duboko ukorijenjen u znanstvenoj zajednici, "bilo bi potrebno mnogo truda da se skine s trona", dodaje West.
Anurag Acharya, suosnivač Google Scholara, pozdravlja sve napore da se znanstvene informacije lakše pronađu, razumiju i nadograde. “Što više svi možemo učiniti, to je bolje za napredak znanosti.”
Najveći i najopsežniji
Google Scholar se uključio 2004. godine pojaviti na sceni istraživanja književnosti i promijenio sve. Tada su istraživači koristili knjižnice za pronalaženje informacija ili tražili akademske radove putem plaćenih online usluga kao što je baza podataka citata Web of Science. Istog mjeseca kada je pokrenut Google Scholar, Elsevier je također pokrenuo svoju plaćenu uslugu Scopus, sveobuhvatnu bazu podataka znanstvenih referenci i sažetaka.
Google Scholar pretraživao je web u potrazi za znanstvenim djelima svih vrsta, kao što su poglavlja knjiga, izvješća, predispisi i web dokumenti—uključujući one na jezicima koji nisu engleski. Cilj je bio "učiniti svjetske istraživače učinkovitijima i omogućiti svima da stoje na zajedničkoj granici znanosti", kaže Acharya.
Ugovori Google Scholara s izdavačima daju mu neusporediv pristup cjelovitim tekstovima članaka koji se nalaze iza sustava za plaćanje - ne samo naslovima i sažetcima koje nudi većina tražilica. Članci su rangirani prema njihovoj relevantnosti za upit za pretraživanje - obično se najčešće citirani članci stavljaju na vrh - i predlažu se daljnji upiti za pretraživanje. Dubina pokrivenosti omogućuje vrlo specifična pretraživanja.
Google nije otkrio podatke o korištenju usluge, ali prema mjeraču web prometa Similarweb, Google Scholar prima više od 100 milijuna posjeta mjesečno.
Baza podataka također je vrlo dobra u usmjeravanju korisnika na besplatne verzije članka, kaže Martín Martín. To potiče pokret otvorenog pristupa, dodaje José Luis Ortega, bibliometričar na Institutu za napredne društvene studije Španjolskog nacionalnog istraživačkog vijeća u Córdobi.
Međutim, Google Scholar je neproziran u drugim aspektima. Ključni problem je nedostatak uvida u to koji se sadržaj, uključujući časopise, pretražuje i koji se algoritam koristi za preporučivanje članaka. Također ograničava masovno preuzimanje svojih rezultata pretraživanja, koji bi se, između ostalog, mogli koristiti za bibliometrijsku analizu. "Nemamo puno uvida u jedan od najvrjednijih alata koje imamo u znanosti", kaže West.
Acharya objašnjava da je Google Scholar prvenstveno alat za pretraživanje i da mu je glavni cilj pomoći znanstvenicima da pronađu najkorisnija istraživanja.
Ažurirane tražilice
Posljednjih godina pojavili su se konkurenti koji nude takve bibliometrijske podatke, iako nitko ne može nadmašiti veličinu Google Scholara i pristup člancima s punim tekstom iza paywalla. Značajan primjer je OpenAlex, pokrenut 2022. Godinu prije, Microsoft Academic Graph, koji je pretraživao akademske informacije na webu, ugašen je, a cijeli skup podataka objavljen. OpenAlex se temelji na ovom i drugim otvorenim izvorima znanstvenih podataka. Korisnici mogu pretraživati sadržaj koji je katalogiziran prema autoru, instituciji i citatu, a mogu i besplatno preuzeti cijeli zapis. "Oni rade ono što smo se nadali da će Google Scholar učiniti", kaže Martín-Martín.
Drugi popularni istraživački alat, Semantic Scholar, pokrenut je 2015. i koristi AI za izradu čitljivih sažetaka radova i prepoznavanje najrelevantnijih citata. Još jedan alat, Konsenzus, pokrenut 2022., koristi bazu podataka Semantic Scholar za pronalaženje odgovora na pitanja temeljena na istraživanju (West je konzultant za Consensus). Jedan od Tayinih omiljenih je Undermind, koji koristi sofisticirano pretraživanje temeljeno na agentima u kojem autonomni entitet skenira znanstvenu literaturu poput čovjeka i prilagođava pretraživanje na temelju pronađenog sadržaja. Za dobivanje rezultata potrebno je nekoliko minuta – u usporedbi sa sekundama na Google Scholar-u, ali Tay objašnjava da se isplati čekati. "Mislim da je kvaliteta rezultata koji se vraćaju bolja od Google Scholar."
Acharya kaže da Google Scholar također koristi AI za rangiranje članaka, sugeriranje dodatnih pretraživanja i preporuku povezanih članaka. A ranije ovog mjeseca, tvrtka je predstavila sažetke članaka generirane umjetnom inteligencijom za svoj PDF čitač. Acharya dodaje da alat za pretraživanje pokušava razumjeti namjeru i kontekst iza upita. Ovaj pristup semantičkog pretraživanja temelji se na jezičnim modelima i koristi se oko dvije godine, kaže.
Jedna stvar koju Google Scholar još ne radi jest uključivanje AI-generiranih pregleda odgovora na traženi upit, sličnih onima koji se sada nalaze na vrhu tipičnog Google pretraživanja. Acharya kaže da je izazovno sažeti zaključke iz više radova na sažet i kontekstom bogat način. "Još nismo vidjeli učinkovito rješenje za ovaj izazov", dodaje.