Anonüümsete geeniandmebaaside haavatavus andmetega seotud rikkumiste suhtes

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Uus uuring näitab, et anonüümsed geneetilised andmebaasid on identiteedivarguste ja andmetega seotud rikkumiste suhtes haavatavad. Teadlased hoiatavad tagajärgede eest.

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
Uus uuring näitab, et anonüümsed geneetilised andmebaasid on identiteedivarguste ja andmetega seotud rikkumiste suhtes haavatavad. Teadlased hoiatavad tagajärgede eest.

Anonüümsete geeniandmebaaside haavatavus andmetega seotud rikkumiste suhtes

Uuring on tekitanud muret, et teadlaste seas üha populaarsemaks muutuvat geneetilist andmebaasi saab kasutada osalejate identiteedi paljastamiseks või privaatse terviseteabe sidumiseks nende avalike geneetiliste profiilidega.

Ühe lahtri andmestikud võib sisaldada teavet geeniekspressiooni kohta miljonites rakkudes, mis on kogutud tuhandetelt inimestelt. Need andmed on sageli vabalt kättesaadavad ja pakuvad väärtuslikku ressurssi teadlastele, kes uurivad haiguste mõju rakutasandil. Väidetavalt on andmed anonüümsed, kuid uuring avaldati 2. oktoobril ajakirjas Cell 1 Näitab, kuidas ühe uuringu geneetilisi andmeid "saab ära kasutada, et paljastada privaatset teavet teises uuringus olevate isikute kohta", kirjutavad autorid.

Tulemused rõhutavad teadlaste huvide ja doonori privaatsuse tasakaalustamise raskust. "Meie genoomid on väga identifitseeritavad. Nad võivad öelda palju meie, meie omaduste ja vastuvõtlikkuse kohta haigustele," ütleb uuringu kaasautor Gamze Gürsoy, New Yorgi Columbia ülikooli bioinformaatika teadur. "Saate muuta oma krediitkaardi numbrit, kui see avalikuks saab, kuid te ei saa oma genoomi muuta."

Tundlikud andmed

Privaatsusprobleemid geneetilistes andmekogumites on varem tõstatatud, kuid on keskendunud peamiselt geneetiliste profiilide "hulgiandmetele". Need sisaldavad teavet geeniaktiivsuse kohta, mis on keskmistatud suure rakupopulatsiooni, mitte üksikute rakkude kohta.

Varem arvati, et üherakulised andmekogumid ei ole erinevate rakkude vahelise "müra" taseme või geeniekspressiooni varieeruvuse tõttu andmerikkumiste suhtes nii haavatavad. Kuid Gürsoy ja tema meeskond suutsid tõestada, et see pole nii.

Meeskond uuris kolme avalikult kättesaadavat üherakulist andmekogumit, mis hõlmasid kroonilise autoimmuunhaiguse luupusega inimeste vererakke. Teadlased leidsid, et nad saavad kasutada geeniekspressiooni andmeid inimese genoomi struktuuri ennustamiseks, kombineerides need väärtused teabega ekspressioonikvantitatiivsete tunnuste lookuste (eQTL) kohta. Üksikasjad eQTL-ide kohta - kromosoomi variatsioonid, mis korreleeruvad geeniekspressiooniga - on samuti avalikult kättesaadavad üherakulistes andmekogumites.

Oma töö usaldusväärsuse testimiseks kontrollisid teadlased oma genoomiprognoose võrreldes kasutatud rakkudele vastava genoomi andmebaasiga. Nad suutsid enamiku andmekogumeid siduda vastava genoomiga üle 80% täpsusega.

Erinevalt geeniekspressiooni andmetest ja eQTL-idest saavad täielikke genoomi andmebaase tavaliselt vaadata ainult teadlased, et kaitsta doonorite identifitseerivat teavet. Teadlased märgivad aga, et osaleja genoomiandmed võivad olla mujal avalikult kättesaadavad. Näiteks võisid nad need üles laadida sugupuu veebisaidile, kus kasutajad esitavad DNA proovid, et oma esivanemate kohta rohkem teada saada. Sel juhul saaks ründaja genoomi analüüsides tuvastada inimese, kelle rakud on üherakulises andmekogumis. See võib paljastada isikuandmeid, mis on seotud tundliku tunnusega, nagu psühhiaatriline häire, kuna uurimistöös osalejad valitakse sageli nende keeruliste seisundite bioloogiat uurima.

Gürsoy ütleb, et sellistel andmete rikkumistel võivad olla tõelised tagajärjed, näiteks diskrimineerimine töökohal. Ta lisab, et lekked võivad mõjutada isegi tulevasi põlvkondi, kuna geneetilised tunnused võivad järglastele edasi anda. "Kõik, mida meist teatakse, on edasi antud põlvkondade kaupa," ütleb ta.

Bradley Malin, kes uurib laiaulatuslikku genoomsete andmete jagamist Vanderbilti ülikoolis Nashville'is, Tennessee's, kirjeldab uuringut kui "uudset täiendust ja panust kirjandusse". Ta lisab, et tulevased uuringud võiksid uurida, kas genoomiandmeid saaks ühendada ka suuremates andmekogumites, mis sisaldavad tuhandete või miljonite inimeste proove.

konkurentsihuvid

Teadlased pole kindlad, kuidas privaatsusprobleeme kõige paremini lahendada. "Seal on soov kaitsta üksikisiku privaatsust, aga ka ühiselt edendada meditsiinilist uurimistööd ja kahjuks on need üksteisega vastuolus," ütleb Mark Gerstein, kes uurib Connecticuti osariigis New Havenis asuvas Yale'i ülikoolis meditsiiniandmete teadust. Lihtsaim lahendus oleks geneetilistele andmetele juurdepääsu raskendamine, kuid see mõjutaks uuringuid negatiivselt, ütleb ta. "Peame jagama ja koondama suurel hulgal teavet," selgitab ta. "Kui me kõik blokeerime ja muudame selle privaatsemaks, takistab see tõesti kogu protsessi."

Gürsoy ja tema kolleegid nõuavad oma uuringus suuremat läbipaistvust oma genoomiandmeid jagavate osalejate riskide osas ja soovitavad teadlastel tagada, et doonorid nõustuksid oma andmete jagamisega. Teine võimalik viis võiks olla isikuandmete krüpteerimine, kui need on osa avalikust andmebaasist. Autorid tunnistavad, et see muudaks dokumentide loomise ja säilitamise protsessi keeruliseks, kuid usuvad, et see võib aidata kaitsta osalejate privaatsust.

  1. Walker, C.R. et al. Lahter https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    Artikkel
    Google Scholar

Laadige alla viited