O Google Scholar pode sobreviver à revolução da IA?
Google Acadêmico comemora 20 anos. Com a nova competição baseada em IA, a questão é: ela conseguirá se manter?

O Google Scholar pode sobreviver à revolução da IA?
O Google Acadêmico, o maior e mais abrangente mecanismo de busca acadêmica, comemora seu 20º aniversário esta semana. Nas últimas duas décadas, alguns pesquisadores notaram que esta ferramenta se tornou uma das ferramentas mais importantes da ciência. Porém, nos últimos anos, surgiram concorrentes que utilizam inteligência artificial (IA) para melhorar a experiência de pesquisa, bem como outros que permitem aos utilizadores descarregar os seus dados.
O impacto do Google Scholar, administrado pelo gigante da Internet Google em Mountain View, Califórnia, é notável, diz Jevin West, cientista social computacional da Universidade de Washington, em Seattle, que utiliza o banco de dados diariamente. Mas “se houve um momento em que o Google Scholar pudesse ser substituído como principal mecanismo de busca, talvez seja agora, por causa de algumas dessas novas ferramentas e das inovações que estão acontecendo em outros lugares”, disse West.
Muitas das vantagens do Google Scholar – o acesso gratuito, a amplitude da informação e as sofisticadas opções de pesquisa – “são agora partilhadas por outras plataformas”, diz Alberto Martín Martín, bibliometrista da Universidade de Granada, em Espanha.
Chatbots com tecnologia de IA como ChatGPT e outras ferramentas que utilizam grandes modelos de linguagem tornaram-se aplicações preferidas por alguns pesquisadores ao pesquisar, revisar e resumir a literatura. Alguns pesquisadores trocaram o Google Scholar por essas ferramentas. “Até recentemente, o Google Scholar era meu mecanismo de busca padrão”, diz Aaron Tay, bibliotecário acadêmico da Singapore Management University. Ainda está no topo da lista, mas “ultimamente comecei a usar outras ferramentas de IA”.
Ainda assim, dado o tamanho do Google Scholar e o quão profundamente enraizado ele está na comunidade científica, “seria necessário muito esforço para destroná-lo”, acrescenta West.
Anurag Acharya, cofundador do Google Scholar, agradece todos os esforços para tornar as informações acadêmicas mais fáceis de encontrar, compreender e desenvolver. “Quanto mais todos pudermos fazer, melhor será para o avanço da ciência.”
O maior e mais completo
O Google Acadêmico entrou em ação 2004 aparecem no cenário da pesquisa literária e mudou tudo. Naquela época, os pesquisadores usavam bibliotecas para encontrar informações ou pesquisavam artigos acadêmicos por meio de serviços on-line pagos, como o banco de dados de citações da Web of Science. No mesmo mês do lançamento do Google Scholar, a Elsevier também lançou seu serviço pago Scopus, um banco de dados abrangente de referências e resumos acadêmicos.
O Google Scholar pesquisou na web trabalhos acadêmicos de todos os tipos, como capítulos de livros, relatórios, pré-impressões e documentos da web – incluindo aqueles em outros idiomas além do inglês. O objetivo era “tornar os investigadores mundiais mais eficazes e permitir que todos se posicionassem numa fronteira comum da ciência”, diz Acharya.
Os acordos do Google Scholar com os editores proporcionam acesso incomparável ao texto completo dos artigos protegidos por acesso pago - não apenas aos títulos e resumos que a maioria dos mecanismos de pesquisa oferece. Os artigos são classificados de acordo com sua relevância para uma consulta de pesquisa - geralmente os artigos mais citados são colocados no topo - e outras consultas de pesquisa são sugeridas. A profundidade da cobertura permite pesquisas altamente específicas.
O Google não divulgou dados de uso do serviço, mas de acordo com o medidor de tráfego da web Similarweb, o Google Scholar recebe mais de 100 milhões de visitas por mês.
O banco de dados também é muito bom para indicar aos usuários versões gratuitas de um artigo, diz Martín Martín. Isto incentiva o movimento de acesso aberto, acrescenta José Luis Ortega, bibliometrista do Instituto de Estudos Sociais Avançados do Conselho Nacional de Pesquisa Espanhol, em Córdoba.
No entanto, o Google Scholar é opaco em outros aspectos. Uma preocupação fundamental é a falta de visibilidade sobre qual conteúdo, incluindo quais periódicos, está sendo pesquisado e qual algoritmo está sendo usado para recomendar artigos. Também restringe downloads em massa de seus resultados de pesquisa, que poderiam ser usados para análises bibliométricas, entre outras coisas. “Não temos muitos insights sobre uma das ferramentas mais valiosas que temos na ciência”, diz West.
Acharya explica que o Google Scholar é principalmente uma ferramenta de busca e seu principal objetivo é ajudar os estudiosos a encontrar as pesquisas mais úteis.
Mecanismos de pesquisa atualizados
Nos últimos anos, surgiram concorrentes que oferecem esses dados bibliométricos, embora nenhum possa superar o tamanho do Google Scholar e o acesso a artigos em texto completo por meio de acesso pago. Um exemplo notável é o OpenAlex, lançado em 2022. No ano anterior, o Microsoft Academic Graph, que pesquisava informações acadêmicas na Web, havia sido encerrado e todo o seu conjunto de dados publicado. OpenAlex baseia-se nesta e em outras fontes abertas de dados científicos. Os usuários podem pesquisar o conteúdo catalogado por autor, instituição e citação, além de baixar gratuitamente o registro completo. “Eles fazem o que esperávamos que o Google Scholar fizesse”, diz Martín-Martín.
Outra ferramenta de pesquisa popular, o Semantic Scholar, lançada em 2015 e usa IA para criar resumos legíveis de artigos e identificar as citações mais relevantes. Outra ferramenta, Consenso, lançado em 2022, usa o banco de dados do Semantic Scholar para encontrar respostas a perguntas baseadas em pesquisas (West é consultor do Consensus). Um dos favoritos de Tay é Mente, que utiliza uma pesquisa sofisticada baseada em agentes, na qual uma entidade autônoma examina a literatura científica como um ser humano e ajusta a pesquisa com base no conteúdo encontrado. Demora alguns minutos – em comparação com segundos no Google Acadêmico – para produzir resultados, mas Tay explica que vale a pena esperar. “Acho que a qualidade dos resultados obtidos é melhor do que a do Google Scholar.”
Acharya diz que o Google Scholar também usa IA para classificar artigos, sugerir pesquisas adicionais e recomendar artigos relacionados. E no início deste mês, a empresa introduziu resumos de artigos gerados por IA para seu leitor de PDF. Acharya acrescenta que a ferramenta de pesquisa tenta compreender a intenção e o contexto por trás de uma consulta. Esta abordagem de busca semântica é baseada em modelos de linguagem e tem sido usada há cerca de dois anos, diz ele.
Uma coisa que o Google Scholar ainda não está fazendo é incorporar visões gerais de respostas geradas por IA a uma consulta pesquisada, semelhantes às encontradas agora no topo de uma pesquisa típica do Google. Acharya diz que é um desafio resumir as conclusões de vários artigos de uma forma concisa e contextualizada. “Ainda não vimos uma solução eficaz para este desafio”, acrescenta.