60% der Amerikaner mit europäischer Abstammung über öffentliche DNA-Datenbanken identifizierbar

Ein junger Computerbiologe hat die Fachwelt geschockt: 60% der Amerikaner europäischer Abstammung können über öffentliche DNA-Datenbanken identifiziert werden,. Und dies unabhängig davon, ob sie ihre eigenen DNA-Daten bei solchen Datenbanken eingereicht haben oder nicht. Der Abgleich mit Stammbäumen macht es möglich.

Es ist ein Thema, welches zwar etwas aus dem Rahmen fällt, aber unter dem weiten Begriff Privatsphäre doch irgendwie in den Blog passt. Zeigt es doch, dass es immer weniger Anonymität gibt. Der aktuelle Forschungsbericht Identity inference of genomic data using long-range familial searches von Yaniv Erlich, Tal Shor, Itsik Pe’er und Shai Carmi ist gerade in Science erschienen.

Zum Hintergrund

GeN-Datenbanken für Verbraucher umfassen mittlerweile DNA-Daten von Millionen von Individuen. Ahnenforschungsplattformen wie 23andMe und Ancestry haben nach jüngsten Branchenschätzungen bisher genetische Profile für mehr als 12 Millionen Menschen erstellt. Die Leute können einen DNA-Schnelltest-Kit bestellen, ihre DNA abgeben und dann analysieren lassen.

Danach besteht die Möglichkeit, diese Informationen zur eigenen DNA herunterzuladen, und diese in öffentlichen Genealogie-Websites wie GEDmatch zu veröffentlichen. Die Idee dahinter: So lassen sich für Ahnenforschung Abstammungslinien nachvollziehen. Die Amerikaner europäischer Abstammung sind da ganz wild drauf.

Ansatz, um Individuen zu deanonymisieren

Genau diese öffentlichen Gen-Datenbanken helfen nun, um eine vorliegende DNA einer bestimmten Person zuzuordnen. Kürzlich haben die Strafverfolgungsbehörden einige dieser öffentlichen Datenbanken genutzt, um mögliche Verdächtige über entfernte Familienangehörige zu identifizieren. Ich hatte im Blog-Beitrag Ahnenforschungsplattform hilft „Golden State Killer“ aufspüren über einen Fall berichtet.

Aber so richtig wird erst durch die Forschungsarbeite um das Team von Yaniv Erlich klar, welche Folgen diese öffentlichen Gen-Datenbanken haben. Deren Postulat:  60% der Amerikaner europäischer Abstammung können über öffentliche DNA-Datenbanken identifiziert werden. Und das unabhängig davon, ob eine Person ihre eigenen DNA-Daten bei einer dieser Datenbanken eingereicht hat oder nicht.

„Es spielt keine Rolle, ob Sie getestet wurden oder nicht“, sagt Erlich, der jetzt Chief Science Officer beim israelischen Anbieter MyHeritage, dem drittgrößten Anbieter von Konsumgenetik hinter 23andMe und Ancestry, ist. „Sie können identifiziert werden, weil die Datenbanken bereits so große Teile der US-Bevölkerung europäischer Abstammung abdecken.“

Ein Team von der Columbia University und der Hebrew University of Jerusalem um um Erlich hat dazu die DNA-Datensätze von 1,28 Millionen Individuen der Plattform MyHeritage, die mit DNA-Kits für Konsumenten ermittelt wurden, untersucht. Das Ergebnis: Die Forscher gehen davon aus, dass etwa 60% der Suchanfragen nach Personen mit europäischer Abstammung zu einem dritten Cousin oder einer engeren Übereinstimmung führen werden. Dies ermöglicht im Anschluss eine Identifizierung der Personen anhand demografischer Merkmale.

Diesen Verwandtschaftsgrad war alles, was die Ermittler brauchten, um den Golden State Killer und 17 andere Fälle mit diesem Ansatz zu lösen. Um die Forschungsergebnisse bei MyHeritage zu bestätigen, glich Erlichs Team 30 genetische Profile mit der öffentlichen DNA-Datenbank von GEDmatch ab. Es gab ähnliche Ergebnisse, wobei 76 Prozent der Suchen Verwandte im dritten Grad (Cousin) oder sogar der näheren Verwandschaft aufspürten.

Die Technik könnte, so schreiben die Forscher, in naher Zukunft fast jede US-amerikanische Person mit europäischer Abstammung betreffen. Die Forscher konnten sogar zeigen, dass die Technik auch Forschungsteilnehmer eines öffentlichen Sequenzierprojektes identifizieren kann (dort werden die DNA-Proben ja anonymisiert). Amerikaner (und möglicherweise bald auch Einwohner weiterer Länder) dürften daher bei (Strafverfolgungs-)behörden standardmäßig über öffentliche Generalogiedatenbanken anhand von DNA-Mustern gescannt werden.

Basierend auf diesen Ergebnissen glauben die Forscher, dass technische Maßnahmen, klare Richtlinien für die Strafverfolgung bei der Nutzung von Generalogie-Suchanfragen und die Achtung der Autonomie der Teilnehmer an genetischen Studien notwendige Komponenten für die langfristige Nachhaltigkeit des genomischen Ökosystems sind. (via)

Ähnliche Artikel:
MyHeritage Datenleck, 90 Millionen Kontendaten abgezogen
Ahnenforschungsplattform hilft „Golden State Killer“ aufspüren

Dieser Beitrag wurde unter Sicherheit abgelegt und mit verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Eine Antwort zu 60% der Amerikaner mit europäischer Abstammung über öffentliche DNA-Datenbanken identifizierbar

  1. Tim sagt:

    Totalüberwachung wird kommen…

    Dagegen sind Google und Co bisher Kinderkram.
    Sowas wartet an Kameraüberwachten Ort bald überall quasi unbemerkt im Vorbeigehen… Viel fehlt ja nicht mehr und wenn ein Schlaumeier meint erst mal die Datenbanken zu verknüpfen…

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert