ADN : les bases de données publiques permettraient d'identifier 60 % de la population américaine
Les tests ADN familiaux, collectés à grande échelle dans des bases de données publiques, permettraient, selon un article publié dans Science, d'identifier 60 % de la population américaine. De quoi soulever des problèmes de confidentialité de la vie privée.
Au printemps dernier, un violeur et tueur en série qui a sévi dans les années 70 et 80 en Californie, a été identifié par les autorités américaines. Cette traque a pu aboutir grâce à une nouvelle technique d'utilisation de l'ADN, se révélant être un nouvel allié très puissant de la criminalistique.
Une nouvelle arme puissante pour la police
Depuis lors, 19 autres affaires auraient été élucidées grâce à cette technique.
Un article publié dans Science dévoile maintenant que les tests ADN familiaux permettent d'ores et déjà d'identifier 60 % des individus américains grâce à cette technique.
Jusqu'à présent, les tests ADN conventionnels visaient à rechercher des correspondances positives, comme celle de l'ADN d'un gant sanglant avec l'ADN d'un suspect spécifique.
Lire aussi : Sécurisation des identifiants et protection contre les attaques par déplacement latéral
Les recherches d'ADN familiales consistent, elles, à recherchent des correspondances partielles, l'échantillon pouvant provenir d'un frère ou d'un parent bien plus éloigné (troisième cousin par exemple) plutôt que de la même personne elle-même.
Si cela n'est pas suffisant pour identifier formellement une spécifique, cela peut donner à la police un avantage décisif pour élucider une affaire.
Par ailleurs, croisés avec d'autres informations, telles qu'une zone géographique spécifique ou l'âge approximatif d'une personne, ces résultats permettent de surcroît de réduire la liste des possibilités à seulement quelques individus.
2 % de la population pour identifier tout le monde
Des entreprises telles que 23andMe et Ancestry auraient jusqu'à présent créé des profils génétiques pour plus de 12 millions de personnes. Les clients qui téléchargent leurs propres informations peuvent ensuite choisir de les ajouter aux sites Web de généalogie publics tels que GEDmatch. C'est précisément cette base de données qui a acquis une notoriété nationale plus tôt dans l'année en ayant aiguillé la police vers un suspect dans l'affaire du Golden State Killer.
Selon la nouvelle étude menée par Yaniv Erlich, responsable scientifique de la société israélienne MyHeritage, et publiée dans Science, plus de 60 % des américains d'origine européenne peuvent être identifiés via leur ADN à l'aide de bases de données de généalogie génétique publiques.
L'étude conclut également qu'une fois que 2 % de la population aura soumis son ADM à de telles bases de données, il sera possible d'identifier presque n'importe qui aux États-Unis.
Lire aussi : Eviden va tripler la capacité de calcul de la Finlande avec un nouveau supercalculateur d'IA
Des problèmes éthiques
De quoi soulever des questions éthiques quant à l'utilisation sans accord préalable de ces données sensibles.
Yaniv Erlich suggère que toutes les informations génétiques soient chiffrées pour les protéger et permettre aux personnes de donner explicitement leur consentement pour l'utilisation de leurs données. Le chercheur et son équipe ont même fourni du code source de démonstration sur GitHub permettant de signer et de vérifier les fichiers de génotype bruts.
D'autres utilisations que celles visant à résoudre des affaires criminelles sont en effet à craindre.
Déjà, en juillet de cette année, un partenariat controversé a été créé entre le géant pharmaceutique GlaxoSmithKline et 23andMe dans le but d'utiliser des données génétiques pour les aider à développer de nouveaux médicaments.
(Photo credit: andylepp via Visualhunt.com / CC BY)
Sur le même thème
Voir tous les articles Data & IA