Může Google Scholar přežít revoluci AI?
Google Scholar slaví 20 let. S novou soutěží založenou na umělé inteligenci vyvstává otázka: Dokáže obstát?

Může Google Scholar přežít revoluci AI?
Google Scholar, největší a nejkomplexnější akademický vyhledávač, slaví tento týden své 20. narozeniny. Během posledních dvou desetiletí někteří výzkumníci poznamenali, že tento nástroj se stal jedním z nejdůležitějších nástrojů ve vědě. V posledních letech se však objevili konkurenti, kteří využívají umělou inteligenci (AI) ke zlepšení zážitku z vyhledávání, a také další, kteří uživatelům umožňují stahovat jejich data.
Dopad Google Scholar, který provozuje internetový gigant Google v Mountain View v Kalifornii, je pozoruhodný, říká Jevin West, počítačový sociální vědec z Washingtonské univerzity v Seattlu, který databázi denně používá. Ale "jestli někdy nastala chvíle, kdy by bylo možné Google Scholar nahradit jako primární vyhledávač, mohlo by to být právě teď, kvůli některým z těchto nových nástrojů a inovacím, které se dějí jinde," řekl West.
Mnohé z výhod Google Scholar – bezplatný přístup, šíře informací a sofistikované možnosti vyhledávání – „nyní sdílejí i jiné platformy,“ říká Alberto Martín Martín, bibliometric na univerzitě v Granadě ve Španělsku.
Chatboti s umělou inteligencí jako ChatGPT a další nástroje, které používají velké jazykové modely, se staly preferovanými aplikacemi některých výzkumníků při vyhledávání, recenzování a shrnutí literatury. Někteří výzkumníci za tyto nástroje vyměnili službu Google Scholar. „Až donedávna byl mým výchozím vyhledávačem Google Scholar,“ říká Aaron Tay, akademický knihovník na Singapore Management University. Stále je na vrcholu jeho seznamu, ale „v poslední době jsem začal používat jiné nástroje umělé inteligence“.
Přesto vzhledem k velikosti Google Scholar a tomu, jak hluboce je zakořeněn ve vědecké komunitě, „bylo by vynaložit velké úsilí, abychom jej sesadili z trůnu,“ dodává West.
Anurag Acharya, spoluzakladatel Google Scholar, vítá veškeré úsilí o to, aby bylo možné vědecké informace snáze najít, pochopit a dále na nich stavět. "Čím více můžeme všichni udělat, tím lépe pro pokrok vědy."
Největší a nejobsáhlejší
Spustil se Google Scholar 2004 se objevují na scéně literárního výzkumu a všechno změnil. Tehdy výzkumníci používali knihovny k vyhledávání informací nebo vyhledávali akademické práce prostřednictvím placených online služeb, jako je citační databáze Web of Science. Ve stejném měsíci, kdy Google Scholar spustil, spustil Elsevier také svou placenou službu Scopus, komplexní databázi odborných referencí a abstraktů.
Google Scholar hledal na webu vědecká díla všeho druhu, jako jsou kapitoly knih, zprávy, předtisky a webové dokumenty – včetně těch v jiných jazycích než v angličtině. Cílem bylo „učinit světové výzkumníky efektivnějšími a umožnit každému stát na společné hranici vědy,“ říká Acharya.
Dohody Google Scholar s vydavateli mu poskytují jedinečný přístup k plnému textu článků za paywallem – nejen k titulkům a abstraktům, které nabízí většina vyhledávačů. Články jsou seřazeny podle jejich relevance k vyhledávacímu dotazu – obvykle jsou nejcitovanější články uvedeny na začátek – a jsou navrženy další vyhledávací dotazy. Hloubka pokrytí umožňuje vysoce specifické vyhledávání.
Google nezveřejnil údaje o využití služby, ale podle měřiče návštěvnosti webu Similarweb získává Google Scholar více než 100 milionů návštěv měsíčně.
Databáze také velmi dobře ukazuje uživatele na bezplatné verze článku, říká Martín Martín. To podporuje hnutí otevřeného přístupu, dodává José Luis Ortega, bibliometrik z Institutu pro pokročilá sociální studia Španělské národní výzkumné rady v Córdobě.
Google Scholar je však v jiných ohledech neprůhledný. Klíčovým problémem je nedostatečná viditelnost toho, jaký obsah, včetně kterých časopisů, je vyhledáván a jaký algoritmus se používá k doporučování článků. Omezuje také hromadné stahování svých výsledků vyhledávání, které by mohly být mimo jiné použity pro bibliometrickou analýzu. "Nemáme moc přehled o jednom z nejcennějších nástrojů, které ve vědě máme," říká West.
Acharya vysvětluje, že Google Scholar je především vyhledávací nástroj a jeho hlavním cílem je pomoci vědcům najít nejužitečnější výzkum.
Aktualizované vyhledávače
V posledních letech se objevili konkurenti nabízející taková bibliometrická data, i když nikdo nemůže překonat velikost Google Scholar a přístup k fulltextovým článkům za paywallem. Pozoruhodným příkladem je OpenAlex, spuštěný v roce 2022. Rok předtím byl ukončen Microsoft Academic Graph, který vyhledával na webu akademické informace, a byl zveřejněn celý jeho datový soubor. OpenAlex staví na tomto a dalších otevřených zdrojích vědeckých dat. Uživatelé mohou vyhledávat v obsahu, který je katalogizován podle autora, instituce a citace, a také si mohou zdarma stáhnout celý záznam. „Dělají to, co jsme doufali, že Google Scholar udělá,“ říká Martín-Martín.
Další populární výzkumný nástroj, Semantic Scholar, byl spuštěn v roce 2015 a využívá AI k vytváření čitelných shrnutí článků a identifikaci nejrelevantnějších citací. Další nástroj, Konsensus, spuštěný v roce 2022, využívá databázi Semantic Scholar k nalezení odpovědí na otázky založené na výzkumu (West je konzultantem společnosti Consensus). Jeden z Tayových oblíbených je Podvědomí, která využívá sofistikované vyhledávání založené na agentech, při kterém autonomní entita prohledává vědeckou literaturu jako člověk a upravuje vyhledávání na základě nalezeného obsahu. Dosažení výsledků trvá několik minut – v porovnání se sekundami ve službě Google Scholar –, ale Tay vysvětluje, že se vyplatí počkat. „Myslím, že kvalita výsledků, které se vracejí, je lepší než Google Scholar.“
Acharya říká, že Google Scholar také používá AI k hodnocení článků, navrhování dalších vyhledávání a doporučování souvisejících článků. A začátkem tohoto měsíce společnost představila souhrny článků generované umělou inteligencí pro svou čtečku PDF. Acharya dodává, že vyhledávací nástroj se pokouší porozumět záměru a kontextu dotazu. Tento přístup sémantického vyhledávání je založen na jazykových modelech a používá se asi dva roky, říká.
Jedna věc, kterou Google Scholar zatím nedělá, je začlenění přehledů odpovědí na hledaný dotaz generovaných umělou inteligencí, podobné těm, které se nyní nacházejí v horní části typického vyhledávání Google. Acharya říká, že je náročné shrnout závěry z více článků stručným a na kontext bohatým způsobem. „Ještě jsme neviděli efektivní řešení této výzvy,“ dodává.