Ali lahko Google Scholar preživi revolucijo AI?

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Google Scholar praznuje 20 let. Z novo konkurenco, ki temelji na umetni inteligenci, je vprašanje: ali lahko zdrži?

Google Scholar feiert 20 Jahre. Angesichts neuer KI-basierter Konkurrenz stellt sich die Frage: Kann es sich behaupten?
Google Scholar praznuje 20 let. Z novo konkurenco, ki temelji na umetni inteligenci, je vprašanje: ali lahko zdrži?

Ali lahko Google Scholar preživi revolucijo AI?

Google Scholar, največji in najobsežnejši akademski iskalnik, ta teden praznuje svoj 20. rojstni dan. V zadnjih dveh desetletjih so nekateri raziskovalci ugotovili, da je to orodje postalo eno najpomembnejših orodij v znanosti. Vendar so se v zadnjih letih pojavili konkurenti, ki uporabljajo umetno inteligenco (AI) za izboljšanje iskalne izkušnje, pa tudi drugi, ki uporabnikom omogočajo prenos njihovih podatkov.

Vpliv Google Scholarja, ki ga vodi spletni velikan Google v Mountain Viewu v Kaliforniji, je izjemen, pravi Jevin West, računalniški družboslovec na Univerzi Washington v Seattlu, ki dnevno uporablja bazo podatkov. Toda "če je kdaj prišlo do trenutka, ko bi Google Scholar lahko zamenjali kot primarni iskalnik, je to morda zdaj, zaradi nekaterih od teh novih orodij in inovacij, ki se dogajajo drugje," je dejal West.

Številne prednosti Google Scholarja – prost dostop, širina informacij in prefinjene možnosti iskanja – »se zdaj delijo z drugimi platformami,« pravi Alberto Martín Martín, bibliometričar na Univerzi v Granadi v Španiji.

Klepetalni roboti, ki jih poganja AI kot je ChatGPT in druga orodja, ki uporabljajo velike jezikovne modele, so za nekatere raziskovalce postala prednostna aplikacija pri iskanju, pregledovanju in povzemanju literature. Nekateri raziskovalci so Google Scholar zamenjali za ta orodja. »Do nedavnega je bil Google Scholar moj privzeti iskalnik,« pravi Aaron Tay, akademski knjižničar na singapurski univerzi za management. Še vedno je na vrhu njegovega seznama, a "v zadnjem času sem začel uporabljati druga orodja AI."

Kljub temu, glede na velikost Google Scholarja in kako globoko je zasidran v znanstveni skupnosti, "bi bilo potrebno veliko truda, da bi ga odstranili s prestola," dodaja West.

Anurag Acharya, soustanovitelj Google Scholar, pozdravlja vsa prizadevanja za lažje iskanje, razumevanje in nadgradnjo znanstvenih informacij. "Več kot lahko naredimo vsi, bolje je za napredek znanosti."

Največji in najobsežnejši

Google Scholar je začel delovati 2004 pojavljajo na prizorišču raziskovanja literature in spremenil vse. Takrat so raziskovalci uporabljali knjižnice za iskanje informacij ali iskanje akademskih člankov prek plačljivih spletnih storitev, kot je podatkovna baza citatov Web of Science. Istega meseca, ko je začel delovati Google Scholar, je Elsevier predstavil tudi svojo plačljivo storitev Scopus, obsežno zbirko znanstvenih referenc in povzetkov.

Google Učenjak je v spletu iskal znanstvena dela vseh vrst, kot so poglavja knjig, poročila, prednatisi in spletni dokumenti – vključno s tistimi v drugih jezikih poleg angleščine. Cilj je bil "narediti svetovne raziskovalce učinkovitejše in vsem omogočiti, da stojijo na skupni meji znanosti," pravi Acharya.

Sporazumi Google Scholarja z založniki mu omogočajo neprimerljiv dostop do celotnega besedila člankov za plačilnimi zidovi – ne le do naslovov in povzetkov, ki jih ponuja večina iskalnikov. Članki so razvrščeni glede na njihovo relevantnost za iskalno poizvedbo - običajno so najbolj citirani članki postavljeni na vrh - in predlagane so nadaljnje iskalne poizvedbe. Globina pokritosti omogoča zelo specifična iskanja.

Google ni razkril podatkov o uporabi storitve, vendar glede na merilnik spletnega prometa Similarweb Google Scholar prejme več kot 100 milijonov obiskov na mesec.

Baza podatkov je prav tako zelo dobra pri usmerjanju uporabnikov na brezplačne različice članka, pravi Martín Martín. To spodbuja gibanje odprtega dostopa, dodaja José Luis Ortega, bibliometrik na Inštitutu za napredne družbene študije Španskega nacionalnega raziskovalnega sveta v Córdobi.

Vendar je Google Scholar v drugih pogledih nepregleden. Ključna skrb je pomanjkanje vpogleda v vsebino, vključno s tem, katere revije se išče, in kateri algoritem se uporablja za priporočanje člankov. Prav tako omejuje množične prenose rezultatov iskanja, ki bi jih lahko med drugim uporabili za bibliometrično analizo. "Nimamo veliko vpogleda v eno najdragocenejših orodij, ki jih imamo v znanosti," pravi West.

Acharya pojasnjuje, da je Google Scholar predvsem orodje za iskanje in njegov glavni cilj je pomagati učenjakom najti najbolj uporabne raziskave.

Posodobljeni iskalniki

V zadnjih letih so se pojavili konkurenti, ki ponujajo takšne bibliometrične podatke, čeprav nobeden ne more premagati velikosti Google Scholarja in dostopa do člankov s polnim besedilom za plačilnimi zidovi. Pomemben primer je OpenAlex, ki je bil predstavljen leta 2022. Leto pred tem je bil Microsoft Academic Graph, ki je po spletu iskal akademske informacije, zaprt in objavljen njegov celoten nabor podatkov. OpenAlex gradi na tem in drugih odprtih virih znanstvenih podatkov. Uporabniki lahko iščejo vsebino, ki je katalogizirana po avtorju, instituciji in citatu, lahko pa tudi brezplačno prenesejo celoten zapis. »Delajo tisto, za kar smo upali, da bo naredil Google Učenjak,« pravi Martín-Martín.

Drugo priljubljeno raziskovalno orodje, Semantic Scholar, je bilo uvedeno leta 2015 in uporablja AI za ustvarjanje berljivih povzetkov člankov in prepoznavanje najpomembnejših citatov. Drugo orodje, Soglasje, ki je bil predstavljen leta 2022, uporablja bazo podatkov Semantic Scholar za iskanje odgovorov na vprašanja, ki temeljijo na raziskavah (West je svetovalec za Consensus). Eden Tayinih najljubših je Undermind, ki uporablja sofisticirano iskanje na osnovi agentov, pri katerem avtonomna entiteta skenira znanstveno literaturo kot človek in prilagodi iskanje glede na najdeno vsebino. Traja nekaj minut – v primerjavi s sekundami v Google Učenjaku –, da dobimo rezultate, vendar Tay pojasnjuje, da se splača počakati. »Mislim, da je kakovost rezultatov, ki se vrnejo, boljša od Google Učenjaka.«

Acharya pravi, da Google Scholar uporablja AI tudi za razvrščanje člankov, predlaganje dodatnih iskanj in priporočanje povezanih člankov. In v začetku tega meseca je podjetje predstavilo povzetke člankov, ustvarjene z AI, za svoj bralnik PDF. Acharya dodaja, da iskalno orodje poskuša razumeti namen in kontekst za poizvedbo. Ta pristop semantičnega iskanja temelji na jezikovnih modelih in se uporablja približno dve leti, pravi.

Ena stvar, ki je Google Scholar še ne počne, je vključevanje pregledov odgovorov na iskano poizvedbo, ki jih ustvari umetna inteligenca, podobnih tistim, ki jih zdaj najdemo na vrhu običajnega iskanja v Googlu. Acharya pravi, da je težko povzeti sklepe iz več člankov na jedrnat in kontekstno bogat način. "Nismo še videli učinkovite rešitve za ta izziv," dodaja.