Anoniminių genų duomenų bazių pažeidžiamumas dėl duomenų pažeidimų

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Naujas tyrimas rodo, kad anoniminės genetinės duomenų bazės yra pažeidžiamos tapatybės vagystės ir duomenų pažeidimų. Mokslininkai įspėja apie pasekmes.

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
Naujas tyrimas rodo, kad anoniminės genetinės duomenų bazės yra pažeidžiamos tapatybės vagystės ir duomenų pažeidimų. Mokslininkai įspėja apie pasekmes.

Anoniminių genų duomenų bazių pažeidžiamumas dėl duomenų pažeidimų

Tyrimas sukėlė susirūpinimą, kad tam tikros rūšies genetinės duomenų bazės, kurios vis labiau populiarėja tarp mokslininkų, gali būti panaudotos siekiant atskleisti dalyvių tapatybę arba susieti privačią informaciją apie sveikatą su jų viešaisiais genetiniais profiliais.

Vieno langelio duomenų rinkiniai gali turėti informacijos apie genų ekspresiją milijonuose ląstelių, surinktų iš tūkstančių žmonių. Šie duomenys dažnai yra laisvai prieinami ir yra vertingas šaltinis mokslininkams, tyrinėjantiems ligų poveikį ląstelių lygiu. Teigiama, kad duomenys yra anonimiški, tačiau spalio 2 d. žurnale Cell paskelbtas tyrimas 1 rodo, kaip vieno tyrimo genetiniai duomenys „gali būti panaudoti siekiant atskleisti privačią informaciją apie asmenis kitame tyrime“, rašo autoriai.

Rezultatai rodo, kad sunku suderinti mokslininkų interesus ir donorų privatumą. "Mūsų genomai labai identifikuoja. Jie gali daug pasakyti apie mus, mūsų savybes ir jautrumą ligoms", - sako tyrimo bendraautorius Gamze Gürsoy, Niujorko Kolumbijos universiteto bioinformatikos tyrinėtojas. „Galite pakeisti savo kredito kortelės numerį, jei jis taps viešas, bet negalite pakeisti savo genomo.

Jautrūs duomenys

Susirūpinimas dėl privatumo genetinių duomenų rinkiniuose buvo iškelti anksčiau, tačiau daugiausia dėmesio buvo skirta genetinių profilių „masiniams duomenims“. Juose yra informacijos apie genų aktyvumo vidurkį didelėje ląstelių populiacijoje, o ne atskirose ląstelėse.

Anksčiau buvo manoma, kad vienos ląstelės duomenų rinkiniai nebus tokie pažeidžiami dėl duomenų pažeidimų dėl „triukšmo“ lygio arba genų ekspresijos skirtumų tarp skirtingų ląstelių. Tačiau Gürsoy ir jos komanda sugebėjo įrodyti, kad taip nėra.

Komanda ištyrė tris viešai prieinamus vienaląsčių duomenų rinkinius, kuriuose buvo kraujo ląstelės iš žmonių, sergančių vilklige, lėtine autoimunine liga. Tyrėjai nustatė, kad jie gali naudoti genų ekspresijos duomenis, kad nuspėtų asmens genomo struktūrą, derindami šias reikšmes su informacija apie ekspresijos kiekybinių bruožų lokusus (eQTL). Išsami informacija apie eQTL – chromosomos variacijas, susijusias su genų ekspresija – taip pat yra viešai prieinama vienos ląstelės duomenų rinkiniuose.

Norėdami patikrinti savo darbo patikimumą, mokslininkai patikrino savo genomo prognozes pagal genomo duomenų bazę, kuri atitiko naudojamas ląsteles. Jie galėjo susieti daugumą duomenų rinkinių su atitinkamu genomu, kurio tikslumas viršijo 80%.

Skirtingai nuo genų ekspresijos duomenų ir eQTL, visas genomo duomenų bazes paprastai gali peržiūrėti tik mokslininkai, kad apsaugotų donorų identifikavimo informaciją. Tačiau mokslininkai pažymi, kad dalyvio genominiai duomenys gali būti viešai prieinami kitur. Pavyzdžiui, jie galėjo juos įkelti į genealogijos svetainę, kurioje vartotojai pateikia DNR mėginius, kad sužinotų daugiau apie savo protėvius. Tokiu atveju užpuolikas galėtų nustatyti asmenį, kurio ląstelės yra vienaląsčių duomenų rinkinyje, analizuodamas jo genomą. Tai gali atskleisti asmens duomenis, susijusius su jautria savybe, pvz., psichikos sutrikimu, nes tyrimo dalyviai dažnai atrenkami tirti šių sudėtingų būklių biologiją.

Tokie duomenų pažeidimai gali turėti realių pasekmių, pavyzdžiui, diskriminaciją darbo vietoje, sako Gürsoy. Ji priduria, kad nutekėjimai gali turėti įtakos net ateities kartoms, nes genetiniai bruožai gali būti perduodami palikuonims. „Viskas, kas apie mus žinoma, perduodama iš kartos į kartą“, – sako ji.

Bradley Malinas, tyrinėjantis didelio masto genominių duomenų dalijimąsi Vanderbilto universitete Nešvilyje, Tenesyje, šį tyrimą apibūdina kaip „naują papildymą ir indėlį į literatūrą“. Jis priduria, kad būsimi tyrimai galėtų ištirti, ar genominiai duomenys taip pat gali būti susieti su didesniais duomenų rinkiniais, kuriuose yra mėginių iš tūkstančių ar milijonų žmonių.

konkurencijos interesus

Mokslininkai nežino, kaip geriausiai spręsti privatumo problemas. „Yra noras apsaugoti asmeninį privatumą, bet taip pat ir kolektyviai tobulinti medicininius tyrimus, ir, deja, tai prieštarauja vienas kitam“, – sako Markas Gersteinas, tyrinėjantis medicinos duomenų mokslą Jeilio universitete Niu Heivene, Konektikuto valstijoje. Paprasčiausias sprendimas būtų apsunkinti prieigą prie genetinių duomenų, tačiau tai neigiamai paveiktų mokslinius tyrimus, sako jis. „Turime dalytis ir kaupti didelius informacijos kiekius“, – aiškina jis. „Jei viską užblokuosime ir padarysime privačiau, tai tikrai trukdys visam procesui.

Savo tyrime Gürsoy ir jos kolegos ragina užtikrinti didesnį skaidrumą apie riziką dalyviams, kurie dalijasi savo genominiais duomenimis, ir siūlo mokslininkams užtikrinti, kad donorai sutiktų dalytis savo duomenimis. Kitas galimas būdas galėtų būti asmens duomenų šifravimas, jei jie yra viešosios duomenų bazės dalis. Autoriai pripažįsta, kad tai apsunkintų įrašų kūrimo ir priežiūros procesą, tačiau mano, kad tai galėtų padėti apsaugoti dalyvių privatumą.

  1. Walker, C. R. ir kt. Ląstelė https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    Straipsnis
    Google Scholar

Atsisiųskite nuorodas