Ευπάθεια ανώνυμων βάσεων δεδομένων γονιδίων σε παραβιάσεις δεδομένων
Μια νέα μελέτη δείχνει ότι οι ανώνυμες γενετικές βάσεις δεδομένων είναι ευάλωτες σε κλοπή ταυτότητας και παραβιάσεις δεδομένων. Οι ερευνητές προειδοποιούν για τις συνέπειες.

Ευπάθεια ανώνυμων βάσεων δεδομένων γονιδίων σε παραβιάσεις δεδομένων
Μια μελέτη έχει εγείρει ανησυχίες ότι ένας τύπος γενετικής βάσης δεδομένων όλο και πιο δημοφιλής μεταξύ των ερευνητών θα μπορούσε να αξιοποιηθεί για να αποκαλύψει την ταυτότητα των συμμετεχόντων ή να συνδέσει ιδιωτικές πληροφορίες υγείας με τα δημόσια γενετικά τους προφίλ.
Σύνολα δεδομένων ενός κελιού μπορεί να περιέχει πληροφορίες σχετικά με την έκφραση γονιδίων σε εκατομμύρια κύτταρα που συλλέγονται από χιλιάδες ανθρώπους. Αυτά τα δεδομένα είναι συχνά ελεύθερα διαθέσιμα και παρέχουν μια πολύτιμη πηγή για τους ερευνητές που μελετούν τις επιπτώσεις της νόσου σε κυτταρικό επίπεδο. Τα δεδομένα λέγεται ότι είναι ανώνυμα, αλλά μια μελέτη δημοσιεύθηκε στις 2 Οκτωβρίου στο περιοδικό Cell 1 δείχνει πώς τα γενετικά δεδομένα από μια μελέτη «μπορούν να αξιοποιηθούν για την αποκάλυψη προσωπικών πληροφοριών για άτομα σε μια άλλη μελέτη», γράφουν οι συγγραφείς.
Τα αποτελέσματα υπογραμμίζουν τη δυσκολία εξισορρόπησης των συμφερόντων των ερευνητών με το απόρρητο των χορηγών. "Τα γονιδιώματά μας ταυτίζονται πολύ. Μπορούν να πουν πολλά για εμάς, τα χαρακτηριστικά μας και την ευαισθησία μας στις ασθένειες", λέει η συν-συγγραφέας της μελέτης Gamze Gürsoy, ερευνήτρια βιοπληροφορικής στο Πανεπιστήμιο Columbia στη Νέα Υόρκη. "Μπορείτε να αλλάξετε τον αριθμό της πιστωτικής σας κάρτας εάν γίνει δημόσιος, αλλά δεν μπορείτε να αλλάξετε το γονιδίωμά σας."
Ευαίσθητα δεδομένα
Ανησυχίες για το απόρρητο στα γενετικά σύνολα δεδομένων έχουν αναφερθεί στο παρελθόν, αλλά έχουν επικεντρωθεί κυρίως σε «μαζικά δεδομένα» γενετικών προφίλ. Αυτά περιέχουν πληροφορίες σχετικά με τη γονιδιακή δραστηριότητα που υπολογίζεται κατά μέσο όρο σε έναν μεγάλο κυτταρικό πληθυσμό και όχι σε μεμονωμένα κύτταρα.
Παλαιότερα πιστευόταν ότι τα σύνολα δεδομένων ενός κυττάρου δεν θα ήταν τόσο ευάλωτα σε παραβιάσεις δεδομένων λόγω του επιπέδου «θορύβου» ή της διακύμανσης της γονιδιακής έκφρασης μεταξύ διαφορετικών κυττάρων. Αλλά η Gürsoy και η ομάδα της μπόρεσαν να αποδείξουν ότι αυτό δεν ισχύει.
Η ομάδα εξέτασε τρία διαθέσιμα στο κοινό σύνολα δεδομένων ενός κυττάρου που περιελάμβαναν κύτταρα αίματος από άτομα με λύκο, μια χρόνια αυτοάνοση νόσο. Οι ερευνητές διαπίστωσαν ότι θα μπορούσαν να χρησιμοποιήσουν δεδομένα γονιδιακής έκφρασης για να προβλέψουν τη δομή του γονιδιώματος ενός ατόμου, συνδυάζοντας αυτές τις τιμές με πληροφορίες σχετικά με τους τόπους ποσοτικών χαρακτηριστικών έκφρασης (eQTLs). Οι λεπτομέρειες των eQTLs - παραλλαγές στο χρωμόσωμα που συσχετίζονται με τη γονιδιακή έκφραση - είναι επίσης διαθέσιμες στο κοινό σε σύνολα δεδομένων ενός κυττάρου.
Για να ελέγξουν την αξιοπιστία της δουλειάς τους, οι ερευνητές έλεγξαν τις προβλέψεις τους για το γονιδίωμα σε σχέση με μια βάση δεδομένων γονιδιώματος που αντιστοιχούσε στα κύτταρα που χρησιμοποιήθηκαν. Κατάφεραν να συνδέσουν τα περισσότερα σύνολα δεδομένων με το αντίστοιχο γονιδίωμα, με ποσοστό ακρίβειας άνω του 80%.
Σε αντίθεση με τα δεδομένα γονιδιακής έκφρασης και τα eQTL, οι πλήρεις βάσεις δεδομένων γονιδιώματος μπορούν συνήθως να προβληθούν μόνο από επιστήμονες για την προστασία των πληροφοριών ταυτοποίησης των δοτών. Ωστόσο, οι ερευνητές σημειώνουν ότι τα γονιδιωματικά δεδομένα ενός συμμετέχοντος θα μπορούσαν να είναι δημόσια διαθέσιμα αλλού. Για παράδειγμα, μπορεί να τα έχουν ανεβάσει σε έναν ιστότοπο γενεαλογίας όπου οι χρήστες υποβάλλουν δείγματα DNA για να μάθουν περισσότερα για την καταγωγή τους. Σε αυτήν την περίπτωση, ένας εισβολέας θα μπορούσε να αναγνωρίσει ένα άτομο του οποίου τα κύτταρα βρίσκονται σε ένα σύνολο δεδομένων ενός κυττάρου, αναλύοντας το γονιδίωμά του. Αυτό θα μπορούσε να αποκαλύψει προσωπικά δεδομένα που σχετίζονται με ένα ευαίσθητο χαρακτηριστικό, όπως μια ψυχιατρική διαταραχή, καθώς οι συμμετέχοντες στην έρευνα επιλέγονται συχνά για να μελετήσουν τη βιολογία αυτών των πολύπλοκων καταστάσεων.
Παραβιάσεις δεδομένων όπως αυτή θα μπορούσαν να έχουν πραγματικές συνέπειες, όπως οι διακρίσεις στο χώρο εργασίας, λέει ο Gürsoy. Προσθέτει ότι οι διαρροές θα μπορούσαν να επηρεάσουν ακόμη και τις μελλοντικές γενιές, επειδή τα γενετικά χαρακτηριστικά μπορούν να μεταδοθούν στους απογόνους. «Όλα όσα είναι γνωστά για εμάς περνάνε από γενιά σε γενιά», λέει.
Ο Bradley Malin, ο οποίος ερευνά την κοινή χρήση γονιδιωματικών δεδομένων μεγάλης κλίμακας στο Πανεπιστήμιο Vanderbilt στο Νάσβιλ του Τενεσί, περιγράφει τη μελέτη ως «καινοφανή προσθήκη και συνεισφορά στη βιβλιογραφία». Προσθέτει ότι μελλοντική έρευνα θα μπορούσε να διερευνήσει εάν τα γονιδιωματικά δεδομένα θα μπορούσαν επίσης να συνδεθούν σε μεγαλύτερα σύνολα δεδομένων που περιέχουν δείγματα από χιλιάδες ή εκατομμύρια ανθρώπους.
ανταγωνιστικά συμφέροντα
Οι επιστήμονες δεν είναι βέβαιοι πώς να αντιμετωπίσουν καλύτερα τις ανησυχίες για το απόρρητο. «Υπάρχει η επιθυμία να προστατευθεί το ατομικό απόρρητο, αλλά και η επιθυμία να προωθηθεί η ιατρική έρευνα συλλογικά, και δυστυχώς αυτά έρχονται σε αντίθεση μεταξύ τους», λέει ο Mark Gerstein, ο οποίος ερευνά την επιστήμη των ιατρικών δεδομένων στο Πανεπιστήμιο Yale στο New Haven του Κονέκτικατ. Η απλούστερη λύση θα ήταν να γίνει πιο δύσκολη η πρόσβαση στα γενετικά δεδομένα, αλλά αυτό θα επηρεάσει αρνητικά την έρευνα, λέει. «Πρέπει να μοιραζόμαστε και να συγκεντρώνουμε μεγάλες ποσότητες πληροφοριών», εξηγεί. «Αν μπλοκάρουμε τα πάντα και τα κάνουμε πιο ιδιωτικά, εμποδίζει πραγματικά την όλη διαδικασία».
Στη μελέτη τους, η Gürsoy και οι συνεργάτες της ζητούν μεγαλύτερη διαφάνεια σχετικά με τους κινδύνους για τους συμμετέχοντες που μοιράζονται τα γονιδιωματικά τους δεδομένα και προτείνουν στους ερευνητές να διασφαλίσουν ότι οι δότες συναινούν στην κοινή χρήση των δεδομένων τους. Μια άλλη πιθανή διαδρομή θα μπορούσε να είναι η κρυπτογράφηση προσωπικών δεδομένων εάν αποτελούν μέρος μιας δημόσιας βάσης δεδομένων. Οι συγγραφείς αναγνωρίζουν ότι αυτό θα περιέπλεκε τη διαδικασία δημιουργίας και διατήρησης αρχείων, αλλά πιστεύουν ότι θα μπορούσε να βοηθήσει στην προστασία του απορρήτου των συμμετεχόντων.
-
Walker, C.R. et al. Κελί https://doi.org/10.1016/j.cell.2024.09.012 (2024).