En ny databas för forskare att dela arvsmassan från farliga virus lovar att lösa många av de problem som hämmar befintliga alternativ. Men först måste forskare övertygas om att använda dem.

Pathoplexus - en kombination av patogen och plexus - lanserades förra månaden, och teamet av forskare bakom databasen hoppas att det kommer att motivera fler forskare att dela genetiska sekvenser av kända och framväxande virus med folkhälsovikt.

Att dela sekvenser så snabbt som möjligt är viktigt för att identifiera nya virus och spåra förändringar som kan göra dem farligare för människor, samt för att utveckla vacciner, förklarar Edward Holmes, en virolog vid University of Sydney, Australien.

Pathoplexus är för närvarande fokuserad på fyra virus som inte är specifikt listade i andra databaser: Krim-Kongo hemorragisk febervirus, Ebola Sudan, Ebola Zaire och West Nile virus. Fler patogener kommer att läggas till senare, sa teamet.

Befintliga hinder

Bland de största befintliga arkiven är GenBank i USA, som erbjuder obegränsad tillgång till sina genomiska data. Men allmänhetens tillgång innebär i teorin att vem som helst kan använda datan för att publicera vetenskapliga artiklar utan att erkänna dataägarna. Detta har avskräckt forskare, särskilt från låginkomstländer, från att dela sina data snabbt, till exempel under en nödsituation för folkhälsan. Ett alternativt arkiv, GISAID, kräver att användare registrerar sig, erkänner dataägare och gör sitt bästa för att samarbeta med ägarna. Databasen har utvecklats för att säkerställa rättigheterna för uppgiftslämnare.

GISAID har varit till stor hjälp under covid-19-pandemin populär och innehåller nästan 17 miljoner sekvenser från SARS-CoV-2, viruset bakom COVID-19. Men forskarna är oroliga för detta genomskinlighet i sin styrning, hur den förmedlar tvister om erkännande och hur den inför sanktioner mot dem som den anser har brutit mot användarvillkoren.

"GISAID har orsakat mycket frustration de senaste åren", säger Spyros Lytras, en evolutionär virolog vid University of Tokyo. "Från dessa erfarenheter har det vetenskapliga samfundet lärt sig hur vi kan göra bättre. En återställning är vad vi behöver som gemenskap, och Pathoplexus kan vara lösningen."

En GISAID-representant sa i ett e-postmeddelande att förtroendet det har med forskarvärlden är starkt och att mer än 70 000 forskare använder webbplatsen. Rollerna för dess styrande organ och finansiärer presenteras på webbplatsen, och deras användarvillkor har inte ändrats sedan grundandet 2008, sa representanten.

Bygg förtroende

Pathoplexus erbjuder vissa skydd för användare. Forskare kan till exempel sätta begränsningar för hur deras data får användas, till exempel kan den inte användas som centralt fokus för vetenskapliga publikationer i upp till ett år utan deras uttryckliga tillstånd. Detta bör ge dataägare tillräckligt med tid att skicka in ett manuskript om sina resultat.

Användare måste också erkänna dataägarna i sina publikationer. "Vi har för avsikt att bygga en gemenskap där forskare har tilltro till att deras bidrag respekteras och erkänns på rätt sätt", säger Jamie Southgate, medlem i Pathoplexus och verksamhetschef för den globala koalitionen Public Health Alliance for Genomic Epidemiology baserad i Kapstaden, Sydafrika.

Pathoplexus kommer inte att blockera någon som bryter mot användarvillkoren från att komma åt webbplatsen, vilket GISAID har gjort det i sällsynta fall. Istället kommer teamet att kontakta tidskrifter för att säkerställa att de publicerade uppgifterna används i enlighet med sättet som de delades på, förklarar Emma Hodcroft, medgrundare av Pathoplexus och en molekylär epidemiolog vid Swiss Tropical and Public Health Institute i Basel, Schweiz. "Vi försökte göra förutsättningarna otroligt tydliga", säger hon.

"Det är en bra, smart lösning", säger Senjuti Saha, en molekylär mikrobiolog vid Child Health Research Foundation i Dhaka, som stödjer praxis att kontakta förlag. "Så ska det vara." Hon tror att Pathoplexus transparens kommer att öka förtroendet inom forskarvärlden.

Men det är fortfarande för tidigt att säga om förvaret kommer att lösa nuvarande datadelningsproblem, säger Saha. "Det är ett utmärkt och fantastiskt första steg."

Användare kan också tendera att dela sekvenser i lokala databaser. I Kina är det till exempel mer sannolikt att forskare publicerar sekvenser av nya virus i kinesiska databaser, säger Shi Mang, en evolutionsbiolog vid Sun Yat-sen University i Shenzhen, Kina, som också sitter i Pathoplexus vetenskapliga rådgivande styrelse. Men för etablerade virus kommer de sannolikt att använda förråd med välskötta samlingar som Pathoplexus erbjuder.

Förbättrad användarupplevelse

Utvecklarna av Pathoplexus har försökt förbättra användarupplevelsen, bland annat genom att göra uppladdningen så enkel som möjligt. Pathoplexus kontrollerar också sekvensdata och medföljande information för fel och hjälper till att organisera virus i undertyper. "Det var faktiskt det som drog mig till den här databasen", säger Shi. Felaktiga sekvenser i nuvarande förvar kan avsevärt hindra forskare, tillägger han.

Hittills har Pathoplexus använt GenBank-data för de fyra virusen för att befolka webbplatsen. Tusentals besökare har redan kommit in på sajten och 50 har skapat konton för att skicka in data, men ingen har skickat in sekvenser än så länge, förklarar Hodcroft. "Vi förväntade oss inte stora mängder data för de patogener vi började med."

Forskare som arbetar med andra virus kommer att behöva vänta tills databasen utökas för att inkludera dem. För att expandera behöver teamet säkra långsiktig finansiering. Sidan drivs för närvarande av frivilliga och donerad datortid, som kommer att upphöra om cirka ett halvår. Hodcroft säger att hennes nuvarande mål är att locka givare. "Jag är försiktigt optimistisk."