Kas Google Scholar suudab AI revolutsiooni üle elada?
Google Scholar tähistab 20. aastapäeva. Uue tehisintellektil põhineva konkurentsi puhul on küsimus: kas see suudab end hoida?

Kas Google Scholar suudab AI revolutsiooni üle elada?
Google Scholar, suurim ja põhjalikum akadeemiline otsingumootor, tähistab sel nädalal oma 20. sünnipäeva. Viimase kahe aastakümne jooksul on mõned teadlased märkinud, et sellest tööriistast on saanud üks tähtsamaid tööriistu teaduses. Viimastel aastatel on aga esile kerkinud nii konkurendid, kes kasutavad tehisintellekti (AI) otsingukogemuse parandamiseks, kui ka teisi, mis võimaldavad kasutajatel oma andmeid alla laadida.
Californias Mountain View'is asuva Interneti-hiiglase Google juhitava Google Scholari mõju on märkimisväärne, ütleb Seattle'i Washingtoni ülikooli arvutuslik sotsiaalteadlane Jevin West, kes kasutab andmebaasi iga päev. Kuid "kui oleks kunagi olnud hetk, kus Google Scholar võiks asendada peamise otsingumootorina, võib see juhtuda nüüd mõne nende uute tööriistade ja mujal toimuvate uuenduste tõttu," ütles West.
Paljud Google Scholari eelised - tasuta juurdepääs, teabe laius ja keerukad otsinguvõimalused - "jagavad nüüd ka teised platvormid," ütleb Alberto Martín Martín, Hispaania Granada ülikooli bibliomeetrik.
AI-toega vestlusrobotid nagu ChatGPT ja muud suuri keelemudeleid kasutavad tööriistad on saanud mõnede teadlaste eelistatud rakendusteks kirjanduse otsimisel, ülevaatamisel ja kokkuvõtete tegemisel. Mõned teadlased on Google Scholari nende tööriistade vastu vahetanud. „Kuni viimase ajani oli Google Scholar minu vaikeotsingumootor,“ ütleb Singapuri juhtimisülikooli akadeemiline raamatukoguhoidja Aaron Tay. See on endiselt tema nimekirja tipus, kuid "hiljuti olen hakanud kasutama teisi AI-tööriistu."
Siiski, arvestades Google Scholari suurust ja seda, kui sügavalt see teadusringkondades on, "nõuaks selle troonilt kukutamine palju pingutusi," lisab West.
Anurag Acharya, Google Scholari kaasasutaja, tervitab kõiki jõupingutusi teadusliku teabe leidmiseks, mõistmiseks ja edasiarendamiseks. "Mida rohkem me kõik teha saame, seda parem on see teaduse edendamiseks."
Suurim ja põhjalikum
Google Scholar astus sisse 2004 ilmuvad kirjanduse uurimise areenile ja muutis kõike. Sel ajal kasutasid teadlased teabe leidmiseks raamatukogusid või otsisid akadeemilisi töid tasuliste veebiteenuste, näiteks Web of Science tsitaatide andmebaasi kaudu. Samal kuul, kui Google Scholar käivitas, käivitas Elsevier ka tasulise teenuse Scopus, põhjaliku teaduslike viidete ja kokkuvõtete andmebaasi.
Google Scholar otsis veebist igasuguseid teaduslikke töid, näiteks raamatute peatükke, aruandeid, eeltrükke ja veebidokumente, sealhulgas neid, mis on muus keeles kui inglise keel. Eesmärk oli "muuta maailma teadlased tõhusamaks ja võimaldada kõigil seista ühisel teaduse piiril," ütleb Acharya.
Google Scholari lepingud kirjastajatega annavad talle võrreldamatu juurdepääsu tasuliste müüride taga olevate artiklite täistekstile – mitte ainult pealkirjadele ja kokkuvõtetele, mida enamik otsingumootoreid pakuvad. Artiklid järjestatakse vastavalt nende asjakohasusele otsingupäringu jaoks – tavaliselt tuuakse enim tsiteeritud artiklid esikohale – ja soovitatakse täiendavaid otsingupäringuid. Katvuse sügavus võimaldab teha väga spetsiifilisi otsinguid.
Google ei avaldanud teenuse kasutusandmeid, kuid veebiliiklusmõõdiku Samaveebi järgi külastab Google Scholar üle 100 miljoni külastuse kuus.
Martín Martín ütleb, et andmebaas on väga hea ka selleks, et suunata kasutajad artikli tasuta versioonidele. See soodustab avatud juurdepääsu liikumist, lisab José Luis Ortega, Córdobas asuva Hispaania riikliku teadusnõukogu kõrgetasemeliste sotsiaaluuringute instituudi bibliomeetrik.
Google Scholar on aga muus osas läbipaistmatu. Peamine probleem on nähtavuse puudumine selle kohta, millist sisu, sealhulgas millistest ajakirjadest otsitakse, ja millist algoritmi artiklite soovitamiseks kasutatakse. Samuti piirab see oma otsingutulemuste massilist allalaadimist, mida saab muu hulgas kasutada bibliomeetriliseks analüüsiks. "Meil ei ole palju ülevaadet ühest kõige väärtuslikumast tööriistast, mis meil teaduses on, " ütleb West.
Acharya selgitab, et Google Scholar on peamiselt otsingutööriist ja selle peamine eesmärk on aidata teadlastel leida kõige kasulikumad uuringud.
Uuendatud otsingumootorid
Viimastel aastatel on selliseid bibliomeetrilisi andmeid pakkuvaid konkurente tekkinud, kuigi ükski ei suuda ületada Google Scholari suurust ja juurdepääsu täistekstiartiklitele tasuliste müüride taga. Märkimisväärne näide on OpenAlex, mis käivitati 2022. aastal. Aasta varem suleti veebist akadeemilist teavet otsinud Microsoft Academic Graph ja avaldati kogu selle andmestik. OpenAlex tugineb sellele ja teistele avatud teaduslike andmete allikatele. Kasutajad saavad otsida autori, asutuse ja tsitaadi järgi kataloogitud sisu ning kogu kirje tasuta alla laadida. "Nad teevad seda, mida me lootsime, et Google Scholar teeb," ütleb Martín-Martín.
Teine populaarne uurimistööriist Semantic Scholar, mis käivitati 2015. aastal ja kasutab tehisintellekti paberite loetavate kokkuvõtete loomiseks ja kõige asjakohasemate tsitaatide tuvastamiseks. Teine tööriist, Konsensus 2022. aastal käivitatud programm kasutab Semantic Scholari andmebaasi, et leida vastuseid teaduspõhistele küsimustele (West on Consensuse konsultant). Tay üks lemmikuid on Alandama, mis kasutab keerukat agendipõhist otsingut, mille puhul autonoomne üksus skannib teaduskirjandust nagu inimene ja kohandab otsingut leitud sisu põhjal. Võrreldes Google Scholari sekunditega kulub tulemuste saamiseks mõni minut, kuid Tay selgitab, et see on ootamist väärt. "Ma arvan, et tulemuste kvaliteet on parem kui Google Scholar."
Acharya ütleb, et Google Scholar kasutab tehisintellekti ka artiklite järjestamiseks, täiendavate otsingute soovitamiseks ja seotud artiklite soovitamiseks. Ja selle kuu alguses tutvustas ettevõte oma PDF-lugeja jaoks AI-ga loodud artiklite kokkuvõtteid. Acharya lisab, et otsingutööriist püüab mõista päringu eesmärki ja konteksti. See semantilise otsingu lähenemisviis põhineb keelemudelitel ja seda on kasutatud umbes kaks aastat, ütleb ta.
Üks asi, mida Google Scholar veel ei tee, on AI-ga loodud ülevaated otsitud päringu vastustest, mis on sarnased nüüd tüüpilise Google'i otsingu ülaosas leiduvatele ülevaadetele. Acharya ütleb, et mitme paberi järeldusi lühidalt ja kontekstirikkalt kokku võtta on keeruline. "Me ei ole veel näinud sellele väljakutsele tõhusat lahendust," lisab ta.