Ranjivost anonimnih baza podataka gena na povrede podataka

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Nova studija pokazuje da su anonimne genetske baze podataka osjetljive na krađu identiteta i povrede podataka. Istraživači upozoravaju na posljedice.

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
Nova studija pokazuje da su anonimne genetske baze podataka osjetljive na krađu identiteta i povrede podataka. Istraživači upozoravaju na posljedice.

Ranjivost anonimnih baza podataka gena na povrede podataka

Studija je izazvala zabrinutost da bi se vrsta genetske baze podataka koja je sve popularnija među istraživačima mogla iskoristiti za otkrivanje identiteta sudionika ili povezivanje privatnih zdravstvenih informacija s njihovim javnim genetskim profilima.

Jednoćelijski skupovi podataka može sadržavati informacije o ekspresiji gena u milijunima stanica prikupljenih od tisuća ljudi. Ti su podaci često besplatno dostupni i predstavljaju vrijedan izvor za istraživače koji proučavaju učinke bolesti na staničnoj razini. Podaci su navodno anonimizirani, no studija objavljena 2. listopada u časopisu Cell 1 pokazuje kako se genetski podaci iz jedne studije "mogu iskoristiti za otkrivanje privatnih informacija o pojedincima u drugoj studiji", pišu autori.

Rezultati naglašavaju poteškoće u uspostavljanju ravnoteže između interesa istraživača i privatnosti donatora. "Naši su genomi vrlo prepoznatljivi. Oni mogu puno reći o nama, našim karakteristikama i našoj osjetljivosti na bolesti", kaže koautorica studije Gamze Gürsoy, istraživačica bioinformatike na Sveučilištu Columbia u New Yorku. "Možete promijeniti broj svoje kreditne kartice ako postane javan, ali ne možete promijeniti svoj genom."

Osjetljivi podaci

Pitanja privatnosti u genetskim skupovima podataka već su se pokretali, ali su se primarno usredotočili na "skupne podatke" genetskih profila. Oni sadrže informacije o aktivnosti gena u prosjeku za veliku populaciju stanica, a ne za pojedinačne stanice.

Prethodno se smatralo da jednostanični skupovi podataka neće biti toliko osjetljivi na povrede podataka zbog razine "šuma" ili varijacija u ekspresiji gena između različitih stanica. Ali Gürsoy i njezin tim uspjeli su dokazati da to nije tako.

Tim je ispitao tri javno dostupna skupa jednostaničnih podataka koji su uključivali krvne stanice ljudi s lupusom, kroničnom autoimunom bolešću. Istraživači su otkrili da mogu koristiti podatke o ekspresiji gena za predviđanje strukture genoma osobe kombinirajući te vrijednosti s informacijama o lokusima kvantitativnih svojstava ekspresije (eQTL). Pojedinosti o eQTL-ovima – varijacijama u kromosomu koje su u korelaciji s ekspresijom gena – također su javno dostupne u jednostaničnim skupovima podataka.

Kako bi testirali pouzdanost svog rada, istraživači su provjerili svoja predviđanja genoma u odnosu na bazu podataka genoma koja odgovara korištenim stanicama. Uspjeli su povezati većinu skupova podataka s odgovarajućim genomom, sa stopom točnosti od preko 80%.

Za razliku od podataka o ekspresiji gena i eQTL-ova, pune baze podataka genoma obično mogu vidjeti samo znanstvenici kako bi zaštitili identifikacijske informacije donatora. Međutim, istraživači primjećuju da bi genomski podaci sudionika mogli biti javno dostupni negdje drugdje. Na primjer, možda su ih prenijeli na genealošku web stranicu gdje korisnici šalju uzorke DNK kako bi saznali više o svom podrijetlu. U ovom slučaju, napadač bi mogao identificirati osobu čije su stanice u jednostaničnom skupu podataka analizirajući njihov genom. To bi moglo otkriti osobne podatke povezane s osjetljivom karakteristikom kao što je psihijatrijski poremećaj, budući da su sudionici istraživanja često odabrani za proučavanje biologije ovih složenih stanja.

Ovakve povrede podataka mogle bi imati stvarne posljedice, poput diskriminacije na radnom mjestu, kaže Gürsoy. Ona dodaje da bi curenje moglo čak utjecati na buduće generacije jer se genetske osobine mogu prenijeti na potomstvo. “Sve što se zna o nama prenosi se generacijama”, kaže ona.

Bradley Malin, koji istražuje razmjenu genomskih podataka velikih razmjera na Sveučilištu Vanderbilt u Nashvilleu, Tennessee, opisuje studiju kao "nov dodatak i doprinos literaturi". Dodaje da bi buduća istraživanja mogla istražiti mogu li se genomski podaci također povezati u veće skupove podataka koji sadrže uzorke tisuća ili milijuna ljudi.

interese konkurencije

Znanstvenici nisu sigurni kako najbolje riješiti pitanja privatnosti. "Postoji želja da se zaštiti privatnost pojedinca, ali i želja da se unaprijede medicinska istraživanja kolektivno, a nažalost to je u suprotnosti jedno s drugim", kaže Mark Gerstein, koji istražuje znanost o medicinskim podacima na Sveučilištu Yale u New Havenu, Connecticut. Najjednostavnije rješenje bilo bi otežati pristup genetskim podacima, ali to bi negativno utjecalo na istraživanje, kaže on. "Moramo dijeliti i prikupljati velike količine informacija", objašnjava. "Ako sve blokiramo i učinimo privatnijim, to stvarno ometa cijeli proces."

U svojoj studiji, Gürsoy i njezini kolege pozivaju na veću transparentnost o rizicima za sudionike koji dijele svoje genomske podatke i sugeriraju da istraživači trebaju osigurati da donatori pristanu na dijeljenje svojih podataka. Drugi mogući put mogao bi biti šifriranje osobnih podataka ako su oni dio javne baze podataka. Autori priznaju da bi to zakompliciralo proces stvaranja i održavanja zapisa, ali vjeruju da bi moglo pomoći u zaštiti privatnosti sudionika.

  1. Walker, C.R. i sur. Ćelija https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    Članak
    Google znalac

Preuzmite reference