Vulnerabilitatea bazelor de date genetice anonime la încălcări ale datelor

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Un nou studiu arată că bazele de date genetice anonime sunt vulnerabile la furtul de identitate și la încălcarea datelor. Cercetătorii avertizează asupra consecințelor.

Eine neue Studie zeigt, dass anonyme genetische Datenbanken anfällig sind für Identitätsdiebstahl und Datenschutzverletzungen. Forschende warnen vor den Folgen.
Un nou studiu arată că bazele de date genetice anonime sunt vulnerabile la furtul de identitate și la încălcarea datelor. Cercetătorii avertizează asupra consecințelor.

Vulnerabilitatea bazelor de date genetice anonime la încălcări ale datelor

Un studiu a ridicat temeri că un tip de bază de date genetică din ce în ce mai populară în rândul cercetătorilor ar putea fi exploatat pentru a dezvălui identitățile participanților sau pentru a lega informațiile private de sănătate la profilurile lor genetice publice.

Seturi de date cu o singură celulă poate conține informații despre expresia genelor în milioane de celule colectate de la mii de oameni. Aceste date sunt adesea disponibile gratuit și oferă o resursă valoroasă pentru cercetătorii care studiază efectele bolilor la nivel celular. Se spune că datele sunt anonimizate, dar un studiu publicat pe 2 octombrie în revista Cell 1 arată cum datele genetice dintr-un studiu „pot fi exploatate pentru a descoperi informații private despre indivizi dintr-un alt studiu”, scriu autorii.

Rezultatele evidențiază dificultatea de a echilibra interesele cercetătorilor cu confidențialitatea donatorului. „Genomurile noastre sunt foarte identificatoare. Pot spune multe despre noi, despre caracteristicile noastre și despre susceptibilitatea noastră la boli”, spune coautorul studiului Gamze Gürsoy, cercetător în bioinformatică la Universitatea Columbia din New York. „Îți poți schimba numărul cardului de credit dacă devine public, dar nu îți poți schimba genomul.”

Date sensibile

Probleme de confidențialitate în seturile de date genetice au fost ridicate înainte, dar s-au concentrat în primul rând pe „date în bloc” ale profilurilor genetice. Acestea conțin mai degrabă informații despre activitatea genelor în medie pe o populație mare de celule decât pe celule individuale.

Se credea anterior că seturile de date cu o singură celulă nu ar fi la fel de vulnerabile la încălcarea datelor din cauza nivelului de „zgomot” sau variației în expresia genelor între diferite celule. Dar Gürsoy și echipa ei au reușit să demonstreze că nu este cazul.

Echipa a examinat trei seturi de date unicelulare disponibile public care au inclus celule sanguine de la persoane cu lupus, o boală autoimună cronică. Cercetătorii au descoperit că ar putea folosi datele despre expresia genelor pentru a prezice structura genomului unei persoane, combinând aceste valori cu informații despre loci de trăsături cantitative de expresie (eQTLs). Detaliile eQTL-urilor - variații ale cromozomului care se corelează cu expresia genelor - sunt, de asemenea, disponibile public în seturile de date cu o singură celulă.

Pentru a testa fiabilitatea muncii lor, cercetătorii și-au verificat predicțiile genomului cu o bază de date a genomului care corespundea celulelor utilizate. Ei au reușit să conecteze cele mai multe seturi de date la genomul corespunzător, cu o rată de precizie de peste 80%.

Spre deosebire de datele despre expresia genelor și eQTL-urile, bazele de date complete ale genomului pot fi de obicei vizualizate doar de oamenii de știință pentru a proteja informațiile de identificare ale donatorilor. Cu toate acestea, cercetătorii observă că datele genomice ale unui participant ar putea fi disponibile public în altă parte. De exemplu, s-ar putea să le fi încărcat pe un site web de genealogie unde utilizatorii trimit mostre de ADN pentru a afla mai multe despre strămoșii lor. În acest caz, un atacator ar putea identifica o persoană ale cărei celule se află într-un set de date cu o singură celulă analizându-și genomul. Acest lucru ar putea dezvălui date personale asociate cu o caracteristică sensibilă, cum ar fi o tulburare psihiatrică, deoarece participanții la cercetare sunt adesea selectați pentru a studia biologia acestor afecțiuni complexe.

Încălcări de date ca aceasta ar putea avea consecințe reale, cum ar fi discriminarea la locul de muncă, spune Gürsoy. Ea adaugă că scurgerile ar putea afecta chiar și generațiile viitoare, deoarece trăsăturile genetice pot fi transmise descendenților. „Tot ceea ce se știe despre noi se transmite din generație în generație”, spune ea.

Bradley Malin, care cercetează schimbul de date genomice la scară largă la Universitatea Vanderbilt din Nashville, Tennessee, descrie studiul ca fiind o „adăugire nouă și o contribuție la literatură”. El adaugă că cercetările viitoare ar putea explora dacă datele genomice ar putea fi, de asemenea, legate în seturi de date mai mari care conțin mostre de la mii sau milioane de oameni.

interese de concurență

Oamenii de știință nu sunt siguri cum să abordeze cel mai bine problemele legate de confidențialitate. „Există dorința de a proteja confidențialitatea individuală, dar și dorința de a avansa cercetarea medicală în mod colectiv și, din păcate, acestea sunt în contradicție între ele”, spune Mark Gerstein, care cercetează știința datelor medicale la Universitatea Yale din New Haven, Connecticut. Cea mai simplă soluție ar fi să faci datele genetice mai dificil de accesat, dar asta ar avea un impact negativ asupra cercetării, spune el. „Trebuie să împărtășim și să adunăm cantități mari de informații”, explică el. „Dacă blocăm totul și îl facem mai privat, chiar împiedică întregul proces.”

În studiul lor, Gürsoy și colegii ei solicită o mai mare transparență cu privire la riscurile pentru participanții care își împărtășesc datele genomice și sugerează că cercetătorii ar trebui să se asigure că donatorii sunt de acord să-și partajeze datele. O altă cale posibilă ar putea fi criptarea datelor personale dacă acestea fac parte dintr-o bază de date publică. Autorii recunosc că acest lucru ar complica procesul de creare și menținere a înregistrărilor, dar cred că ar putea ajuta la protejarea confidențialității participanților.

  1. Walker, C.R. şi colab. Celula https://doi.org/10.1016/j.cell.2024.09.012 (2024).

    Articol
    Google Academic

Descărcați referințe