Articles

Qu’Est-Ce Qui Nous Différencie ?

Il y a neuf ans, j’ai sauté sur l’occasion de rejoindre l’équipe internationale qui identifiait la séquence des bases d’ADN, ou « lettres”, dans le génome du chimpanzé commun (Pan troglodytes). En tant que biostatisticien avec un intérêt de longue date pour les origines humaines, j’avais hâte d’aligner la séquence d’ADN humain à côté de celle de notre parent vivant le plus proche et de faire le point. Une vérité humiliante a émergé: nos plans d’ADN sont presque identiques à 99% aux leurs. Autrement dit, sur les trois milliards de lettres qui composent le génome humain, seulement 15 millions d’entre elles — moins de 1 pour cent — ont changé au cours des six millions d’années environ depuis que les lignées humaine et chimpanzée ont divergé.

La théorie de l’évolution soutient que la grande majorité de ces changements ont eu peu ou pas d’effet sur notre biologie. Mais quelque part parmi ces quelque 15 millions de bases se trouvent les différences qui nous ont rendus humains. J’étais déterminé à les trouver. Depuis lors, moi et d’autres avons fait des progrès alléchants dans l’identification d’un certain nombre de séquences d’ADN qui nous distinguent des chimpanzés.

Une surprise précoce

Bien que ne représentant qu’un petit pourcentage du génome humain, des millions de bases constituent encore un vaste territoire à rechercher. Pour faciliter la chasse, j’ai écrit un programme informatique qui scannerait le génome humain à la recherche des morceaux d’ADN qui ont le plus changé depuis que les humains et les chimpanzés se sont séparés d’un ancêtre commun. Parce que la plupart des mutations génétiques aléatoires ne profitent ni ne nuisent à un organisme, elles s’accumulent à un rythme constant qui reflète le temps qui s’est écoulé depuis que deux espèces vivantes ont eu un ancêtre commun (ce taux de changement est souvent appelé « tic-tac de l’horloge moléculaire”). L’accélération de ce taux de changement dans une partie du génome, en revanche, est une caractéristique de la sélection positive, dans laquelle les mutations qui aident un organisme à survivre et à se reproduire sont plus susceptibles d’être transmises aux générations futures. En d’autres termes, les parties du code qui ont subi le plus de modifications depuis la scission chimpanzé-humain sont les séquences qui ont le plus probablement façonné l’humanité.

En novembre 2004, après des mois de débogage et d’optimisation de mon programme pour qu’il fonctionne sur une grappe informatique massive à l’Université de Californie à Santa Cruz, je me suis finalement retrouvé avec un fichier contenant une liste classée de ces séquences en évolution rapide. Avec mon mentor David Haussler penché sur mon épaule, j’ai regardé le coup supérieur, un tronçon de 118 bases qui, ensemble, est devenu connu sous le nom de région accélérée humaine 1 (HAR1). En utilisant le U.C. Santa Cruz genome browser, un outil de visualisation qui annote le génome humain avec des informations provenant de bases de données publiques, j’ai zoomé sur HAR1. Le navigateur a montré les séquences HAR1 d’un humain, d’un chimpanzé, d’une souris, d’un rat et d’un poulet — toutes les espèces de vertébrés dont les génomes avaient alors été décodés. Il a également révélé que de précédentes expériences de dépistage à grande échelle avaient détecté une activité HAR1 dans deux échantillons de cellules cérébrales humaines, bien qu’aucun scientifique n’ait encore nommé ou étudié la séquence. Nous avons crié: « Génial! »à l’unisson quand nous avons vu que HAR1 pourrait faire partie d’un gène nouveau pour la science qui est actif dans le cerveau.

Nous avions touché le jackpot. Le cerveau humain est bien connu pour différer considérablement du cerveau des chimpanzés en termes de taille, d’organisation et de complexité, entre autres traits. Pourtant, les mécanismes développementaux et évolutifs sous-jacents aux caractéristiques qui distinguent le cerveau humain sont mal compris. HAR1 avait le potentiel d’éclairer cet aspect le plus mystérieux de la biologie humaine.

Nous avons passé l’année suivante à découvrir tout ce que nous pouvions sur l’histoire évolutive de HAR1 en comparant cette région du génome chez diverses espèces, y compris 12 autres vertébrés qui ont été séquencés pendant cette période. Il s’avère que jusqu’à l’arrivée des humains, HAR1 a évolué extrêmement lentement. Chez les poulets et les chimpanzés — dont les lignées ont divergé il y a environ 300 millions d’années — seules deux des 118 bases diffèrent, contre 18 différences entre les humains et les chimpanzés, dont les lignées ont divergé beaucoup plus récemment. Le fait que HAR1 ait été essentiellement figé dans le temps pendant des centaines de millions d’années indique qu’il fait quelque chose de très important; qu’il ait ensuite subi une révision brutale chez l’homme suggère que cette fonction a été significativement modifiée dans notre lignée.

Un indice critique de la fonction de HAR1 dans le cerveau est apparu en 2005, après que mon collaborateur Pierre Vanderhaeghen de l’Université Libre de Bruxelles a obtenu un flacon de copies de HAR1 de notre laboratoire lors d’une visite à Santa Cruz. Il a utilisé ces séquences d’ADN pour concevoir une étiquette moléculaire fluorescente qui s’allumerait lorsque HAR1 était activé dans des cellules vivantes— c’est-à-dire copiée de l’ADN dans l’ARN. Lorsque des gènes typiques sont activés dans une cellule, la cellule effectue d’abord une copie de l’ARN messager mobile, puis utilise l’ARN comme modèle pour synthétiser une protéine nécessaire. L’étiquetage a révélé que HAR1 est actif dans un type de neurone qui joue un rôle clé dans le motif et la disposition du cortex cérébral en développement, la couche cérébrale la plus externe ridée. Lorsque les choses tournent mal dans ces neurones, le résultat peut être un trouble congénital grave, souvent mortel, connu sous le nom de lissencéphalie (« cerveau lisse”), dans lequel le cortex n’a pas ses plis caractéristiques et présente une surface nettement réduite. Les dysfonctionnements de ces mêmes neurones sont également liés à l’apparition de la schizophrénie à l’âge adulte.

HAR1 est donc actif au bon moment et au bon endroit pour contribuer à la formation d’un cortex sain. (D’autres preuves suggèrent qu’il peut également jouer un rôle dans la production de sperme.) Mais exactement comment ce morceau du code génétique affecte le développement du cortex est un mystère que mes collègues et moi essayons toujours de résoudre. Nous sommes impatients de le faire: la récente explosion de substitutions de HAR1 peut avoir modifié notre cerveau de manière significative.

En plus d’avoir une histoire évolutive remarquable, HAR1 est spécial car il ne code pas une protéine. Pendant des décennies, la recherche en biologie moléculaire s’est concentrée presque exclusivement sur les gènes qui spécifient les protéines, les éléments constitutifs de base des cellules. Mais grâce au Projet du génome humain, qui a séquencé notre propre génome, les scientifiques savent maintenant que les gènes codant pour les protéines ne représentent que 1,5% de notre ADN. L’autre pourcentage de 98,5 — parfois appelé ADN indésirable — contient des séquences régulatrices qui indiquent à d’autres gènes quand allumer et éteindre et des gènes codant pour l’ARN qui ne se traduit pas en protéine, ainsi que beaucoup d’ADN ayant des objectifs que les scientifiques commencent seulement à comprendre.

Sur la base des motifs de la séquence HAR1, nous avons prédit que HAR1 code pour l’ARN – une intuition que Sofie Salama, Haller Igel et Manuel Ares, tous à U.C. Santa Cruz, confirmée par la suite en 2006 par des expériences en laboratoire. En fait, il s’avère que HAR1 humain réside dans deux gènes qui se chevauchent. La séquence HAR1 partagée donne naissance à un tout nouveau type de structure d’ARN, s’ajoutant aux six classes connues de gènes d’ARN. Ces six grands groupes englobent plus de 1 000 familles différentes de gènes d’ARN, chacun se distinguant par la structure et la fonction de l’ARN codé dans la cellule. HAR1 est également le premier exemple documenté d’une séquence codant pour l’ARN qui semble avoir subi une sélection positive.

Il peut sembler surprenant que personne n’ait prêté attention à ces 118 bases étonnantes du génome humain plus tôt. Mais en l’absence de technologie permettant de comparer facilement des génomes entiers, les chercheurs n’avaient aucun moyen de savoir que HAR1 était plus qu’un simple morceau d’ADN indésirable.

Indices linguistiques

Les comparaisons du génome entier chez d’autres espèces ont également fourni un autre aperçu crucial de la raison pour laquelle les humains et les chimpanzés peuvent être si différents bien que leurs génomes se ressemblent beaucoup. Au cours de la dernière décennie, les génomes de milliers d’espèces (principalement des microbes) ont été séquencés. Il s’avère que l’endroit où les substitutions d’ADN se produisent dans le génome — plutôt que le nombre de changements qui surviennent dans l’ensemble — peut avoir beaucoup d’importance. En d’autres termes, vous n’avez pas besoin de changer une grande partie du génome pour créer une nouvelle espèce. La façon de faire évoluer un humain à partir d’un ancêtre chimpanzé-humain n’est pas d’accélérer le tic-tac de l’horloge moléculaire dans son ensemble. Le secret est plutôt que des changements rapides se produisent dans des sites où ces changements font une différence importante dans le fonctionnement d’un organisme.

HAR1 est certainement un tel endroit. Il en va de même pour le gène FOXP2, qui contient une autre des séquences à évolution rapide que j’ai identifiées et qui est connue pour être impliquée dans la parole. Son rôle dans la parole a été découvert par des chercheurs de l’Université d’Oxford, qui ont rapporté en 2001 que les personnes ayant des mutations dans le gène sont incapables d’effectuer certains mouvements faciaux subtils et à grande vitesse nécessaires à la parole humaine normale, même si elles possèdent la capacité cognitive de traiter le langage. La séquence humaine typique présente plusieurs différences par rapport à celle du chimpanzé: deux substitutions de base qui ont modifié son produit protéique et de nombreuses autres substitutions qui ont pu entraîner des changements affectant comment, quand et où la protéine est utilisée dans le corps humain.

Une découverte a mis en lumière le moment où la version permettant la parole de FOXP2 est apparue chez les hominidés: en 2007, des scientifiques de l’Institut Max Planck d’anthropologie évolutive de Leipzig ont séquencé FOXP2 extrait d’un fossile néandertalien et ont découvert que ces humains éteints possédaient la version humaine moderne du gène, leur permettant peut-être d’énoncer comme nous le faisons. Les estimations actuelles pour la séparation des lignées humaines néandertaliennes et modernes suggèrent que la nouvelle forme de FOXP2 doit avoir émergé il y a au moins un demi-million d’années. Cependant, la plupart de ce qui distingue le langage humain de la communication vocale chez d’autres espèces ne provient pas de moyens physiques, mais de la capacité cognitive, qui est souvent corrélée à la taille du cerveau. Les primates ont généralement un cerveau plus grand que ce à quoi on pourrait s’attendre de leur taille corporelle. Mais le volume du cerveau humain a plus que triplé depuis le chimpanzé – ancêtre humain — une poussée de croissance que les chercheurs en génétique ont seulement commencé à démêler.

L’un des exemples les mieux étudiés d’un gène lié à la taille du cerveau chez l’homme et d’autres animaux est l’ASPM. Des études génétiques sur des personnes atteintes d’une maladie connue sous le nom de microcéphalie, dans laquelle le cerveau est réduit jusqu’à 70%, ont révélé le rôle de l’ASPM et d’un autre gène — CDK5RAP2 — dans le contrôle de la taille du cerveau. Plus récemment, des chercheurs de l’Université de Chicago, de l’Université du Michigan et de l’Université de Cambridge ont montré que l’ASPM a connu plusieurs sursauts de changement au cours de l’évolution des primates, un schéma révélateur d’une sélection positive. Au moins un de ces sursauts s’est produit dans la lignée humaine car il a divergé de celui des chimpanzés et a donc potentiellement joué un rôle dans l’évolution de nos grands cerveaux.

D’autres parties du génome peuvent avoir influencé moins directement la métamorphose du cerveau humain. L’analyse informatique qui a identifié HAR1 a également trouvé 201 autres régions accélérées par l’homme, dont la plupart ne codent pas pour des protéines ou même de l’ARN. (Une étude connexe menée au Wellcome Trust Sanger Institute à Cambridge, en Angleterre, a détecté plusieurs des mêmes HARs.) Au lieu de cela, ils semblent être des séquences régulatrices qui indiquent aux gènes voisins quand allumer et éteindre. Étonnamment, plus de la moitié des gènes situés près du SARs sont impliqués dans le développement et la fonction du cerveau. Et, comme c’est le cas pour FOXP2, les produits de plusieurs de ces gènes régulent d’autres gènes. Ainsi, même si les SARs constituent une infime partie du génome, des changements dans ces régions auraient pu modifier profondément le cerveau humain en influençant l’activité de réseaux entiers de gènes.

Au-delà du cerveau

Bien que de nombreuses recherches génétiques se soient concentrées sur l’élucidation de l’évolution de notre cerveau sophistiqué, les chercheurs ont également reconstitué comment d’autres aspects uniques du corps humain sont apparus. HAR2, une région régulatrice des gènes et le deuxième site le plus accéléré de ma liste, en est un exemple. En 2008, des chercheurs du Lawrence Berkeley National Laboratory ont montré que des différences de base spécifiques dans la version humaine de HAR2 (également connue sous le nom de HACNS1), par rapport à la version chez les primates non humains, permettent à cette séquence d’ADN de stimuler l’activité génique du poignet et du pouce pendant le développement fœtal, alors que la version ancestrale chez les autres primates ne le peut pas. Cette découverte est particulièrement provocante car elle pourrait étayer des changements morphologiques dans la main humaine qui ont permis la dextérité nécessaire à la fabrication et à l’utilisation d’outils complexes.

En plus de subir des changements de forme, nos ancêtres ont également subi des changements comportementaux et physiologiques qui les ont aidés à s’adapter à des circonstances modifiées et à migrer dans de nouveaux environnements. Par exemple, la conquête du feu il y a plus d’un million d’années et la révolution agricole il y a environ 10 000 ans ont rendu les aliments riches en amidon plus accessibles. Mais les changements culturels à eux seuls n’étaient pas suffisants pour exploiter ces comestibles riches en calories. Nos prédécesseurs ont dû s’adapter génétiquement à eux.

Les modifications du gène AMY1, qui code pour l’amylase salivaire, une enzyme impliquée dans la digestion de l’amidon, constituent une adaptation bien connue de ce type. Le génome des mammifères contient plusieurs copies de ce gène, le nombre de copies variant d’une espèce à l’autre et même d’un humain à l’autre. Mais dans l’ensemble, par rapport aux autres primates, les humains ont un nombre particulièrement important de copies d’AMY1. En 2007, des généticiens de l’Université d’État de l’Arizona ont montré que les personnes portant plus de copies d’AMY1 ont plus d’amylase dans leur salive, leur permettant ainsi de digérer plus d’amidon. L’évolution d’AMY1 semble donc impliquer à la fois le nombre de copies du gène et les modifications spécifiques de sa séquence d’ADN.

Un autre exemple célèbre d’adaptation alimentaire concerne le gène de la lactase (LCT), une enzyme qui permet aux mammifères de digérer le lactose glucidique, également appelé sucre du lait. Chez la plupart des espèces, seuls les nourrissons qui allaitent peuvent traiter le lactose. Mais il y a environ 9 000 ans — très récemment, en termes évolutifs — des changements dans le génome humain ont produit des versions de LCT qui ont permis aux adultes de digérer le lactose. Le LCT modifié a évolué indépendamment dans les populations européennes et africaines, permettant aux porteurs de digérer le lait d’animaux domestiqués. Aujourd’hui, les descendants adultes de ces anciens éleveurs sont beaucoup plus susceptibles de tolérer le lactose dans leur alimentation que les adultes d’autres régions du monde, y compris l’Asie et l’Amérique latine, dont beaucoup sont intolérants au lactose en raison de la version ancestrale du gène primate.

Le LCT n’est pas le seul gène connu pour évoluer chez l’homme en ce moment. Le chimp genome project en a identifié 15 autres en train de s’éloigner d’une version parfaitement normale chez nos ancêtres singes et qui fonctionne bien chez d’autres mammifères mais, sous cette forme ancienne, est associée à des maladies telles que la maladie d’Alzheimer et le cancer chez les humains modernes. Plusieurs de ces troubles affectent les humains seuls ou se produisent à des taux plus élevés chez les humains que chez les autres primates. Les scientifiques étudient les fonctions des gènes impliqués dans une tentative d’établir pourquoi les versions ancestrales de ces gènes sont devenues inadaptées aux États-Unis. Ces études pourraient aider les médecins à identifier les patients qui ont plus de chances de contracter l’une de ces maladies potentiellement mortelles, dans l’espoir de les aider à prévenir la maladie. Les études peuvent également aider les chercheurs à développer de nouveaux traitements.

Avec le Bon Vient le Mauvais

Lorsque les chercheurs examinent le génome humain à la recherche de preuves de sélection positive, les meilleurs candidats sont fréquemment impliqués dans l’immunité. Il n’est pas surprenant que l’évolution bricole autant avec ces gènes: en l’absence d’antibiotiques et de vaccins, l’obstacle le plus probable pour que les individus transmettent leurs gènes serait probablement une infection potentiellement mortelle qui frappe avant la fin de leurs années de procréation. L’adaptation constante des agents pathogènes à nos défenses accélère encore l’évolution du système immunitaire, entraînant une course aux armements évolutive entre microbes et hôtes.

Les traces de ces luttes sont laissées dans notre ADN. Cela est particulièrement vrai pour les rétrovirus, tels que le VIH, qui survivent et se propagent en insérant leur matériel génétique dans nos génomes. L’ADN humain est jonché de copies de ces génomes rétroviraux courts, dont beaucoup proviennent de virus qui ont causé des maladies il y a des millions d’années et qui peuvent ne plus circuler. Au fil du temps, les séquences rétrovirales accumulent des mutations aléatoires comme n’importe quelle autre séquence, de sorte que les différentes copies sont similaires mais pas identiques. En examinant la quantité de divergence entre ces copies, les chercheurs peuvent utiliser des techniques d’horloge moléculaire pour dater l’infection rétrovirale originale. Les cicatrices de ces infections anciennes sont également visibles dans les gènes du système immunitaire de l’hôte qui s’adaptent constamment pour combattre les rétrovirus en constante évolution.

PtERV1 est l’un de ces virus relique. Chez l’homme moderne, une protéine appelée TRIM5a agit pour empêcher la réplication de PtERV1 et des rétrovirus apparentés. Des preuves génétiques suggèrent qu’une épidémie de PtERV1 a frappé d’anciens chimpanzés, gorilles et humains vivant en Afrique il y a environ quatre millions d’années. Pour étudier comment différents primates ont réagi à PtERV1, en 2007, des chercheurs du Fred Hutchinson Cancer Research Center de Seattle ont utilisé les nombreuses copies mutées aléatoirement de PtERV1 dans le génome du chimpanzé pour reconstruire la séquence originale de PtERV1 et recréer cet ancien rétrovirus. Ils ont ensuite effectué des expériences pour voir dans quelle mesure les versions humaine et grand singe du gène TRIM5a pouvaient restreindre l’activité du virus PtERV1 ressuscité. Leurs résultats indiquent qu’un seul changement du TRIM5a humain a probablement permis à nos ancêtres de lutter plus efficacement contre l’infection par le PtERV1 que ne le pouvaient nos cousins primates.

Vaincre un type de rétrovirus ne garantit pas nécessairement un succès continu contre les autres, cependant. Même si les changements dans le TRIM5a humain nous ont peut-être aidés à survivre à PtERV1, ces mêmes changements rendent beaucoup plus difficile la lutte contre le VIH. Cette découverte aide les chercheurs à comprendre pourquoi l’infection par le VIH conduit au sida chez l’homme mais le fait moins fréquemment chez les primates non humains. De toute évidence, l’évolution peut faire un pas en avant et deux pas en arrière. Parfois, la recherche scientifique ressent la même chose. Nous avons identifié de nombreux candidats intéressants pour expliquer la base génétique des traits humains distinctifs. Dans la plupart des cas, cependant, nous ne connaissons que les bases de la fonction de ces séquences génomiques. Les lacunes dans nos connaissances sont particulièrement importantes pour des régions telles que HAR1 et HAR2 qui ne codent pas les protéines.

Ces séquences en évolution rapide indiquent une voie à suivre. L’histoire de ce qui nous a rendus humains ne va probablement pas se concentrer sur les changements dans nos blocs de construction protéiques, mais plutôt sur la façon dont l’évolution a assemblé ces blocs de nouvelles manières en changeant quand et où dans le corps différents gènes s’activent et s’éteignent. Des études expérimentales et informatiques en cours dans des milliers de laboratoires à travers le monde promettent d’élucider ce qui se passe dans les 98,5% de notre génome qui ne codent pas pour les protéines. Il ressemble de moins en moins à de la camelote tous les jours.