Dokáže Google Scholar prežiť revolúciu AI?

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Študovňa Google oslavuje 20 rokov. S novou konkurenciou založenou na AI vyvstáva otázka: Dokáže obstáť?

Google Scholar feiert 20 Jahre. Angesichts neuer KI-basierter Konkurrenz stellt sich die Frage: Kann es sich behaupten?
Študovňa Google oslavuje 20 rokov. S novou konkurenciou založenou na AI vyvstáva otázka: Dokáže obstáť?

Dokáže Google Scholar prežiť revolúciu AI?

Google Scholar, najväčší a najkomplexnejší akademický vyhľadávací nástroj, oslavuje tento týždeň svoje 20. narodeniny. Počas posledných dvoch desaťročí niektorí výskumníci poznamenali, že tento nástroj sa stal jedným z najdôležitejších nástrojov vo vede. V posledných rokoch sa však objavili konkurenti, ktorí využívajú umelú inteligenciu (AI) na zlepšenie zážitku z vyhľadávania, ako aj iní, ktorí používateľom umožňujú sťahovanie ich údajov.

Vplyv programu Google Scholar, ktorý prevádzkuje internetový gigant Google v Mountain View v Kalifornii, je pozoruhodný, hovorí Jevin West, počítačový sociálny vedec z Washingtonskej univerzity v Seattli, ktorý databázu používa denne. Ale „ak niekedy nastala chvíľa, kedy by mohla byť služba Google Scholar nahradená ako primárny vyhľadávací nástroj, mohlo by to byť teraz, kvôli niektorým z týchto nových nástrojov a inováciám, ktoré sa dejú inde,“ povedal West.

Mnohé z výhod Študovne Google – bezplatný prístup, šírka informácií a sofistikované možnosti vyhľadávania – „teraz zdieľajú aj iné platformy,“ hovorí Alberto Martín Martín, bibliometrický pracovník Univerzity v Granade v Španielsku.

Chatboty poháňané AI ako ChatGPT a ďalšie nástroje, ktoré využívajú veľké jazykové modely, sa stali preferovanými aplikáciami niektorých výskumníkov pri vyhľadávaní, recenzovaní a sumarizovaní literatúry. Niektorí vedci vymenili Google Scholar za tieto nástroje. „Až donedávna bol môj predvolený vyhľadávací nástroj Google Scholar,“ hovorí Aaron Tay, akademický knihovník na Singapore Management University. Stále je na vrchole jeho zoznamu, ale „v poslednej dobe som začal používať iné nástroje AI“.

Napriek tomu, vzhľadom na veľkosť Google Scholar a na to, ako hlboko je zakorenený vo vedeckej komunite, „by si vyžadovalo veľa úsilia, aby sme ho zosadili z trónu,“ dodáva West.

Anurag Acharya, spoluzakladateľ Google Scholar, víta všetky snahy o to, aby sa odborné informácie ľahšie našli, porozumeli a aby sa na nich stavalo. "Čím viac môžeme všetci urobiť, tým lepšie pre pokrok vedy."

Najväčší a najkomplexnejší

Spustila sa služba Študovňa Google 2004 sa objavujú na scéne výskumu literatúry a zmenil všetko. Vtedy vedci využívali knižnice na vyhľadávanie informácií alebo vyhľadávanie akademických prác prostredníctvom platených online služieb, ako je napríklad citačná databáza Web of Science. V tom istom mesiaci, kedy spustil Google Scholar, Elsevier spustil aj svoju platenú službu Scopus, komplexnú databázu odborných referencií a abstraktov.

Študovňa Google hľadala na webe vedecké diela všetkého druhu, ako sú kapitoly kníh, správy, predtlače a webové dokumenty vrátane tých, ktoré sú v iných jazykoch ako angličtina. Cieľom bolo „učiniť svetových výskumníkov efektívnejšími a umožniť každému postaviť sa na spoločnú hranicu vedy,“ hovorí Acharya.

Dohody služby Študovňa Google s vydavateľmi jej poskytujú jedinečný prístup k úplnému textu článkov za platenými stenami – nielen k názvom a abstraktom, ktoré ponúka väčšina vyhľadávacích nástrojov. Články sú zoradené podľa ich relevancie k vyhľadávaciemu dopytu – zvyčajne sa najcitovanejšie články dostanú na začiatok – a navrhnú sa ďalšie vyhľadávacie dopyty. Hĺbka pokrytia umožňuje vysoko špecifické vyhľadávanie.

Google nezverejnil údaje o používaní služby, ale podľa merača návštevnosti webu Similarweb dostáva Google Scholar viac ako 100 miliónov návštev mesačne.

Databáza tiež veľmi dobre ukazuje používateľov na bezplatné verzie článku, hovorí Martín Martín. To podporuje hnutie otvoreného prístupu, dodáva José Luis Ortega, bibliometrik z Inštitútu pre pokročilé sociálne štúdie Španielskej národnej rady pre výskum v Córdobe.

Google Scholar je však v iných ohľadoch nepriehľadný. Kľúčovým problémom je nedostatok prehľadu o tom, aký obsah vrátane časopisov sa vyhľadáva a aký algoritmus sa používa na odporúčanie článkov. Obmedzuje tiež hromadné sťahovanie svojich výsledkov vyhľadávania, ktoré by sa okrem iného mohli použiť na bibliometrickú analýzu. "Nemáme veľa informácií o jednom z najcennejších nástrojov, ktoré máme vo vede," hovorí West.

Acharya vysvetľuje, že Google Scholar je predovšetkým vyhľadávací nástroj a jeho hlavným cieľom je pomôcť vedcom nájsť najužitočnejší výskum.

Aktualizované vyhľadávače

V posledných rokoch sa objavili konkurenti ponúkajúci takéto bibliometrické údaje, hoci nikto nemôže prekonať veľkosť Google Scholar a prístup k plnotextovým článkom za platenými stenami. Pozoruhodným príkladom je OpenAlex, ktorý bol spustený v roku 2022. Rok predtým bol Microsoft Academic Graph, ktorý vyhľadával na webe akademické informácie, vypnutý a celý jeho súbor údajov bol zverejnený. OpenAlex stavia na tomto a ďalších otvorených zdrojoch vedeckých údajov. Používatelia môžu vyhľadávať v obsahu, ktorý je katalogizovaný podľa autora, inštitúcie a citácie, a tiež si môžu bezplatne stiahnuť celý záznam. „Robia to, v čo sme dúfali, že Google Scholar urobí,“ hovorí Martín-Martín.

Ďalší populárny výskumný nástroj, Semantic Scholar, bol spustený v roku 2015 a využíva AI na vytváranie čitateľných súhrnov článkov a identifikáciu najrelevantnejších citácií. Ďalší nástroj, Konsenzus, spustený v roku 2022, využíva databázu Semantic Scholar na nájdenie odpovedí na otázky založené na výskume (West je konzultantom pre Consensus). Jeden z Tayových obľúbených je Podvedomie, ktorá využíva sofistikované vyhľadávanie na základe agentov, pri ktorom autonómna entita prehľadáva vedeckú literatúru ako človek a prispôsobuje vyhľadávanie na základe nájdeného obsahu. Dosiahnutie výsledkov trvá niekoľko minút – v porovnaní so sekundami v službe Študovňa Google –, ale Tay vysvetľuje, že sa oplatí počkať. „Myslím si, že kvalita výsledkov, ktoré sa vracajú, je lepšia ako v službe Študovňa Google.“

Acharya hovorí, že Google Scholar tiež používa AI na hodnotenie článkov, navrhovanie ďalších vyhľadávaní a odporúčanie súvisiacich článkov. A začiatkom tohto mesiaca spoločnosť predstavila súhrny článkov generované AI pre svoju čítačku PDF. Acharya dodáva, že vyhľadávací nástroj sa pokúša pochopiť zámer a kontext za dopytom. Tento prístup sémantického vyhľadávania je založený na jazykových modeloch a používa sa asi dva roky, hovorí.

Jedna vec, ktorú Google Scholar zatiaľ nerobí, je začlenenie prehľadov odpovedí na hľadaný dopyt generovaných AI, podobných tým, ktoré sa teraz nachádzajú v hornej časti typického vyhľadávania Google. Acharya hovorí, že je náročné zhrnúť závery z viacerých článkov stručným a kontextovo bohatým spôsobom. „Efektívne riešenie tejto výzvy sme ešte nevideli,“ dodáva.