Kan Google Scholar de AI-revolutie overleven?
Google Scholar bestaat twintig jaar. Met de nieuwe, op AI gebaseerde concurrentie is de vraag: kan deze zich staande houden?

Kan Google Scholar de AI-revolutie overleven?
Google Scholar, de grootste en meest uitgebreide academische zoekmachine, viert deze week zijn twintigste verjaardag. In de afgelopen twintig jaar hebben sommige onderzoekers opgemerkt dat dit instrument een van de belangrijkste instrumenten in de wetenschap is geworden. De afgelopen jaren zijn er echter concurrenten opgedoken die kunstmatige intelligentie (AI) gebruiken om de zoekervaring te verbeteren, evenals andere die gebruikers in staat stellen hun gegevens te downloaden.
De impact van Google Scholar, gerund door internetgigant Google in Mountain View, Californië, is opmerkelijk, zegt Jevin West, een computationeel sociaal wetenschapper aan de Universiteit van Washington in Seattle die de database dagelijks gebruikt. Maar "als er ooit een moment was waarop Google Scholar zou kunnen worden vervangen als de belangrijkste zoekmachine, zou het nu kunnen zijn, vanwege enkele van deze nieuwe tools en de innovaties die elders plaatsvinden", aldus West.
Veel van de voordelen van Google Scholar (de gratis toegang, de breedte van de informatie en de geavanceerde zoekopties) "worden nu gedeeld door andere platforms", zegt Alberto Martín Martín, een bibliometrie aan de Universiteit van Granada in Spanje.
AI-aangedreven chatbots zoals ChatGPT en andere tools die grote taalmodellen gebruiken, zijn voor sommige onderzoekers voorkeurstoepassingen geworden bij het zoeken, beoordelen en samenvatten van de literatuur. Sommige onderzoekers hebben Google Scholar ingeruild voor deze tools. “Tot voor kort was Google Scholar mijn standaardzoekmachine”, zegt Aaron Tay, academisch bibliothecaris aan de Singapore Management University. Het staat nog steeds bovenaan zijn lijstje, maar "de laatste tijd ben ik andere AI-tools gaan gebruiken."
Maar gezien de omvang van Google Scholar en hoe diepgeworteld het is in de wetenschappelijke gemeenschap, "zou het veel moeite kosten om het van de troon te stoten", voegt West eraan toe.
Anurag Acharya, mede-oprichter van Google Scholar, verwelkomt alle inspanningen om wetenschappelijke informatie gemakkelijker te vinden, te begrijpen en erop te bouwen. “Hoe meer we allemaal kunnen doen, hoe beter het is voor de vooruitgang van de wetenschap.”
De grootste en meest uitgebreide
Google Scholar is van start gegaan 2004 verschijnen op het toneel van literatuuronderzoek en veranderde alles. Destijds gebruikten onderzoekers bibliotheken om informatie te vinden of zochten ze naar academische artikelen via betaalde online diensten zoals de Web of Science-citatiedatabase. In dezelfde maand dat Google Scholar werd gelanceerd, lanceerde Elsevier ook de betaalde dienst Scopus, een uitgebreide database met wetenschappelijke referenties en samenvattingen.
Google Scholar zocht op internet naar allerlei soorten wetenschappelijke werken, zoals hoofdstukken in boeken, rapporten, preprints en webdocumenten, ook in andere talen dan het Engels. Het doel was om “de onderzoekers van de wereld effectiever te maken en iedereen in staat te stellen zich op een gemeenschappelijke grens van de wetenschap te bevinden”, zegt Acharya.
De overeenkomsten van Google Scholar met uitgevers geven het bedrijf ongeëvenaarde toegang tot de volledige tekst van artikelen achter betaalmuren - niet alleen tot de titels en samenvattingen die de meeste zoekmachines aanbieden. De artikelen worden gerangschikt op basis van hun relevantie voor een zoekopdracht (meestal worden de meest geciteerde artikelen bovenaan geplaatst) en verdere zoekopdrachten worden voorgesteld. De diepte van de dekking maakt zeer specifieke zoekopdrachten mogelijk.
Google heeft geen gebruiksgegevens voor de dienst bekendgemaakt, maar volgens de webverkeersmeter Soortgelijkeweb ontvangt Google Scholar meer dan 100 miljoen bezoeken per maand.
De database is ook erg goed in het verwijzen van gebruikers naar gratis versies van een artikel, zegt Martín Martín. Dit moedigt de open access-beweging aan, voegt José Luis Ortega toe, bibliometrist bij het Institute for Advanced Social Studies van de Spaanse Nationale Onderzoeksraad in Córdoba.
Google Scholar is echter in andere opzichten ondoorzichtig. Een belangrijk punt van zorg is het gebrek aan inzicht in welke inhoud, inclusief welke tijdschriften, wordt doorzocht en welk algoritme wordt gebruikt om artikelen aan te bevelen. Het beperkt ook het massaal downloaden van zoekresultaten, die onder meer kunnen worden gebruikt voor bibliometrische analyses. “We hebben niet veel inzicht in een van de meest waardevolle instrumenten die we in de wetenschap hebben”, zegt West.
Acharya legt uit dat Google Scholar in de eerste plaats een zoekhulpmiddel is en dat het hoofddoel ervan is om wetenschappers te helpen het nuttigste onderzoek te vinden.
Bijgewerkte zoekmachines
De afgelopen jaren zijn er concurrenten ontstaan die dergelijke bibliometrische gegevens aanbieden, hoewel geen enkele de omvang van Google Scholar en de toegang tot volledige tekstartikelen achter betaalmuren kan verslaan. Een opmerkelijk voorbeeld is OpenAlex, gelanceerd in 2022. Het jaar daarvoor was de Microsoft Academic Graph, die op internet naar academische informatie zocht, stilgelegd en de volledige dataset gepubliceerd. OpenAlex bouwt voort op deze en andere open bronnen van wetenschappelijke gegevens. Gebruikers kunnen zoeken in de inhoud die is gecatalogiseerd op auteur, instelling en citaat, en kunnen ook het volledige record gratis downloaden. “Ze doen wat we hoopten dat Google Scholar zou doen”, zegt Martín-Martín.
Een andere populaire onderzoekstool, Semantic Scholar, werd in 2015 gelanceerd en gebruikt AI om leesbare samenvattingen van artikelen te maken en de meest relevante citaten te identificeren. Een ander hulpmiddel, Overeenstemming, gelanceerd in 2022, gebruikt de database van Semantic Scholar om antwoorden te vinden op op onderzoek gebaseerde vragen (West is een consultant voor Consensus). Een van Tay's favorieten is Ondermijn, dat gebruik maakt van geavanceerde agent-based search, waarbij een autonome entiteit als mens de wetenschappelijke literatuur scant en de zoekopdracht aanpast op basis van de gevonden inhoud. Het duurt een paar minuten (vergeleken met seconden op Google Scholar) om resultaten te produceren, maar Tay legt uit dat het het wachten waard is. “Ik denk dat de kwaliteit van de resultaten die terugkomen beter is dan die van Google Scholar.”
Acharya zegt dat Google Scholar ook AI gebruikt om artikelen te rangschikken, aanvullende zoekopdrachten voor te stellen en gerelateerde artikelen aan te bevelen. En eerder deze maand introduceerde het bedrijf door AI gegenereerde artikelsamenvattingen voor zijn PDF-lezer. Acharya voegt eraan toe dat de zoekfunctie probeert de intentie en context achter een zoekopdracht te begrijpen. Deze semantische zoekaanpak is gebaseerd op taalmodellen en wordt al ongeveer twee jaar gebruikt, zegt hij.
Eén ding dat Google Scholar nog niet doet, is het opnemen van door AI gegenereerde overzichten van antwoorden op een zoekopdracht, vergelijkbaar met de overzichten die nu bovenaan een typische Google-zoekopdracht staan. Acharya zegt dat het een uitdaging is om conclusies uit meerdere artikelen op een beknopte en contextrijke manier samen te vatten. “We hebben nog geen effectieve oplossing voor deze uitdaging gezien”, voegt hij eraan toe.