Allgemein

Kann Google Scholar die KI-Revolution überstehen?

Google Scholar, die größte und umfassendste wissenschaftliche Suchmaschine, feiert in dieser Woche ihren 20. Geburtstag. In den letzten zwei Jahrzehnten haben einige Forscher festgestellt, dass dieses Tool zu einem der wichtigsten Instrumente in der Wissenschaft geworden ist. In den letzten Jahren sind jedoch Wettbewerber aufgekommen, die künstliche Intelligenz (KI) nutzen, um das Sucherlebnis zu verbessern, sowie andere, die es Nutzern ermöglichen, ihre Daten herunterzuladen.

Die Auswirkungen von Google Scholar, die von dem Internetgiganten Google in Mountain View, Kalifornien, betrieben wird, sind bemerkenswert, sagt Jevin West, ein computational social scientist an der University of Washington in Seattle, der die Datenbank täglich nutzt. Doch „wenn es jemals einen Moment gab, in dem Google Scholar als Hauptsuchmaschine abgelöst werden könnte, dann könnte dies jetzt der Fall sein, aufgrund einiger dieser neuen Tools und der Innovationen, die an anderen Orten stattfinden“, so West.

Viele der Vorteile von Google Scholar – der kostenlose Zugang, die Breite der Informationen und die ausgeklügelten Suchoptionen – „werden jetzt von anderen Plattformen geteilt“, sagt Alberto Martín Martín, Bibliometriker an der Universität Granada in Spanien.

KI-gestützte Chatbots wie ChatGPT und andere Tools, die große Sprachmodelle verwenden, haben sich für einige Wissenschaftler zu bevorzugten Anwendungen entwickelt, wenn es darum geht, die Literatur zu durchsuchen, zu überprüfen und zusammenzufassen. Einige Forscher haben Google Scholar gegen diese Tools eingetauscht. „Bis vor kurzem war Google Scholar meine Standard-Suchmaschine“, sagt Aaron Tay, ein wissenschaftlicher Bibliothekar an der Singapore Management University. Es steht immer noch an erster Stelle auf seiner Liste, aber „in letzter Zeit habe ich begonnen, andere KI-Tools zu nutzen“.

Dennoch, angesichts der Größe von Google Scholar und wie tief es in der wissenschaftlichen Gemeinschaft verankert ist, „würde es viel Anstrengung erfordern, es vom Thron zu stoßen“, fügt West hinzu.

Anurag Acharya, Mitbegründer von Google Scholar, begrüßt alle Bemühungen, wissenschaftliche Informationen leichter zu finden, zu verstehen und darauf aufzubauen. „Je mehr wir alle tun können, desto besser ist es für den Fortschritt der Wissenschaft.“

Die größte und umfassendste

Google Scholar trat 2004 auf der Bildfläche der Literaturrecherche in Erscheinung und veränderte alles. Damals nutzten Forscher Bibliotheken, um Informationen zu finden, oder suchten akademische Papers über kostenpflichtige Online-Dienste wie die Zitationsdatenbank Web of Science. Im selben Monat, in dem Google Scholar startete, wurde auch der kostenpflichtige Dienst Scopus von Elsevier ins Leben gerufen, eine umfangreiche Datenbank wissenschaftlicher Referenzen und Abstracts.

Google Scholar durchsuchte das Web nach wissenschaftlichen Arbeiten jeglicher Art, wie Buchkapiteln, Berichten, Preprints und Web-Dokumenten – einschließlich solcher in anderen Sprachen als Englisch. Das Ziel war, „die Forscher der Welt effektiver zu machen und es allen zu ermöglichen, auf einer gemeinsamen Grenze der Wissenschaft zu stehen“, sagt Acharya.

Die Vereinbarungen von Google Scholar mit Verlagen verschaffen ihm einen unvergleichlichen Zugang zu den Volltexten von Artikeln hinter Bezahlschranken – nicht nur zu Titeln und Abstracts, die die meisten Suchmaschinen anbieten. Die Artikel werden nach ihrer Relevanz zu einer Suchanfrage eingestuft – in der Regel werden die meistzitierten Artikel an die Spitze gebracht – und es werden weitere Suchanfragen vorgeschlagen. Die Tiefe der Abdeckung ermöglicht hochspezifische Suchen.

Google gab keine Nutzungsdaten für den Dienst bekannt, aber laut dem Web-Traffic-Meter Similarweb erhält Google Scholar über 100 Millionen Besuche pro Monat.

Die Datenbank ist auch sehr gut darin, Nutzer auf kostenlose Versionen eines Artikels hinzuweisen, sagt Martín Martín. Dies fördert die Open-Access-Bewegung, fügt José Luis Ortega, ein Bibliometriker am Institut für Fortgeschrittene Sozialstudien des Spanischen Nationalen Forschungsrats in Córdoba, hinzu.

Allerdings ist Google Scholar in anderer Hinsicht undurchsichtig. Ein zentrales Anliegen ist der Mangel an Einblick, welche Inhalte, einschließlich welcher Fachzeitschriften, durchsucht werden und welcher Algorithmus verwendet wird, um Artikel zu empfehlen. Zudem schränkt es Massen-Downloads seiner Suchergebnisse ein, die unter anderem für bibliometrische Analysen verwendet werden könnten. „Wir haben nicht viel Einblick in eines der wertvollsten Tools, die wir in der Wissenschaft haben“, sagt West.

Acharya erklärt, dass Google Scholar hauptsächlich ein Suchtool ist und sein Hauptziel darin besteht, Wissenschaftlern zu helfen, die nützlichsten Forschungen zu finden.

Aktualisierte Suchmaschinen

In den letzten Jahren sind Wettbewerber aufgetaucht, die eine solche bibliometrische Daten anbieten, obwohl keiner die Größe und den Zugang zu Volltextartikeln hinter Bezahlschranken von Google Scholar übertreffen kann. Ein bemerkenswertes Beispiel ist das 2022 gestartete OpenAlex. Im Jahr zuvor war das Microsoft Academic Graph, das das Web nach wissenschaftlichen Informationen durchsuchte, eingestellt und sein gesamtes Datenset veröffentlicht worden. OpenAlex baut auf diesem und anderen offenen Quellen wissenschaftlicher Daten auf. Nutzer können die Inhalte, die katalogisiert werden, nach Autoren, Institutionen und Zitationen durchsuchen und auch die gesamten Aufzeichnungen kostenlos herunterladen. „Sie machen das, was wir uns von Google Scholar erhofft hatten“, sagt Martín-Martín.

Ein weiteres beliebtes Forschungstool, Semantic Scholar, wurde 2015 eingeführt und nutzt KI, um lesbare Zusammenfassungen von Arbeiten zu erstellen und die relevantesten Zitationen zu identifizieren. Ein weiteres Tool, Consensus, wurde 2022 ins Leben gerufen und nutzt die Datenbank von Semantic Scholar, um Antworten auf von der Forschung informierte Fragen zu finden (West ist Berater für Consensus). Eines von Tays Favoriten ist Undermind, das eine ausgeklügelte agentenbasierte Suche verwendet, bei der eine autonome Entität die wissenschaftliche Literatur wie ein Mensch scannt und die Suche basierend auf dem gefundenen Inhalt anpasst. Es dauert einige Minuten – im Vergleich zu Sekunden bei Google Scholar – um Ergebnisse zu liefern, aber Tay erklärt, dass sich das Warten lohnt. „Ich finde, die Qualität der Ergebnisse, die zurückkommen, ist besser als bei Google Scholar.“

Acharya sagt, dass Google Scholar auch KI nutzt, um Artikel zu bewerten, weitere Suchanfragen vorzuschlagen und verwandte Artikel zu empfehlen. Und Anfang dieses Monats stellte das Unternehmen KI-generierte Artikelübersichten für seinen PDF-Reader vor. Acharya fügt hinzu, dass das Suchtool versucht, die Absicht und den Kontext hinter einer Anfrage zu verstehen. Dieser semantische Suchansatz basiert auf Sprachmodellen und wird bereits seit etwa zwei Jahren verwendet, sagt er.

Eine Sache, die Google Scholar noch nicht tut, ist die Einbeziehung von KI-generierten Überblicken zu Antworten auf eine gesuchte Anfrage, ähnlich denen, die nun an der Spitze einer typischen Google-Suche zu finden sind. Acharya sagt, dass es herausfordernd sei, Schlussfolgerungen aus mehreren Arbeiten auf eine prägnante und kontextreiche Weise zusammenzufassen. „Wir haben bisher keine effektive Lösung für diese Herausforderung gesehen“, fügt er hinzu.

Schaltfläche "Zurück zum Anfang"