Des mathématiques pour visualiser les relations ancestrales entre échantillons d’ADN ancien

Recherche
le  17 septembre 2020
Shutterstock
Shutterstock
Des chercheurs de l’Université Grenoble Alpes (Laboratoire TIMC – UGA/CNRS/Grenoble INP) et de l’Université Paris-Saclay (Laboratoire de Recherche en Informatique – CNRS/Inria) publient dans le revue Nature Communications une étude portant sur une méthode mathématique permettant de représenter géométriquement l'ADN de populations anciennes tout en préservant leurs relations de parenté. Dans le futur, elle pourra être appliquée à tous les organismes, des virus aux grands animaux, afin de mieux comprendre l'histoire des peuplements ou l'évolution des organismes en fonction des modifications de leurs environnements.
Stimulée par l’essor de technologies de séquençage à haut débit, la paléo-génomique permet l’analyse de l'ADN d’organismes pouvant dater de milliers d’années. Les molécules séquencées (ADN ancien) proviennent notamment de sites archéologiques, de collections de musées, et d’échantillons conservés dans la glace ou le pergélisol. La paléo-génomique a permis de nombreuses avancées dans l’étude de l’histoire évolutive des populations anciennes, leurs migrations passées et leurs relations avec les populations modernes. Dans ce domaine, l’analyse mathématique des relations entre populations anciennes à partir de l’ADN est toutefois compliquée par le caractère aléatoire de l’évolution des fréquences des gènes, appelé dérive génétique, dont la variabilité dépend en particulier de la taille des populations étudiées. Les approches actuelles contrôlent les effets de ce phénomène en utilisant des populations de référence dont les génomes sont préalablement disponibles. Toutefois, les chercheurs ne disposent pas toujours de génomes de référence adéquats et leur choix peut influencer l’estimation des relations ancestrales entre échantillons étudiés.

Dans une étude publiée cette semaine, des chercheurs de l’Université Grenoble-Alpes et de l’Université Paris-Saclay ont proposé une méthode mathématique et informatique permettant de représenter visuellement des échantillons d’ADN ancien de sorte à refléter leurs relations ancestrales. Cette représentation permet de s’affranchir du choix des génomes de référence et d’estimer avec plus de précision les coefficients d’ascendance génétique des échantillons étudiés. Les auteurs ont appliqué leur approche à l’analyse d’une base de données d’ADN ancien mise à disposition par le laboratoire de David Reich à l’Université Harvard. Pour des échantillons datant de la période mésolithique au moyen âge, l’étude précise les contributions relatives des groupes de chasseurs-cueilleurs d’Europe de l’Ouest, des premiers fermiers d’Anatolie et des éleveurs de la steppe pontique (culture Yamnaya). L’étude confirme qu'une migration très importante s'est produite, il y a 4500 ans, depuis la steppe pontique vers le nord et le centre de l'Europe, puis vers les îles britanniques et la France. Les populations européennes plus récentes ont conservé dans leur patrimoine génétique une importante contribution des populations de la steppe pontique, notamment en Scandinavie et dans les îles britanniques.

L'approche proposée dans cette étude a permis de révéler de nombreux détails concernant la structure génétique des populations européennes. De tels détails, masqués dans les méthodes précédentes, étaient obscurcis par le phénomène de dérive génétique.

La méthodologie proposée dans l’étude rend possible l’analyse de la variation génétique des populations en prenant en compte la spécificité temporelle des échantillons d'ADN. Dans le futur, elle pourra être appliquée à tous les organismes, des virus aux grands animaux, afin de mieux comprendre l'histoire des peuplements ou l'évolution des organismes en fonction des modifications de leurs environnements. D’après l’un des deux auteurs, la clé du succès de ce travail, mêlant génomique des populations, calcul des probabilités, anthropologie moléculaire, nouveaux algorithmes et un programme informatique open-source, est d’avoir bénéficié du support de laboratoires de recherche en France permettant des activités interdisciplinaires de haut niveau qui ne pourraient pas avoir lieu sans cela.



Figure 1
Analyse factorielle de 704 anciens individus eurasiens d'âge compris entre 400 et 14000 ans. Le premier axe sépare les chasseurs-cueilleurs occidentaux (Serbie) des premiers agriculteurs (Anatolie), tandis que le second axe correspond à l'ascendance steppique. Un changement majeur dans la composition génétique des populations de Grande-Bretagne et d'Europe centrale est observé vers 4500 ans (ligne pointillée). HG: Chasseurs-Cueilleurs, N: Néolithique, MN: Néolithique moyen, C: âge du cuivre, EBA: âge du bronze ancien.
Publié le  15 septembre 2020
Mis à jour le  17 septembre 2020