Articles

L’importance de la Théorie Neutre en 1968 et 50 ans après: Une réponse à Kern et Hahn 2018

La Théorie Neutre de l’Évolution moléculaire affirme que la plupart des mutations de novo sont soit suffisamment délétères dans leurs effets sur la forme physique qu’elles ont peu de chances de se fixer dans la population, soit soumises à une sélection si faible qu’elles peuvent devenir fixé à la suite d’une dérive génétique (Kimura 1968, 1983; King et Jukes 1969). De plus, le taux de substitution des mutations neutres entre les espèces est égal au taux de mutation (Kimura 1968). Une première extension critique de ce cadre impliquait l’inclusion de mutations presque neutres, ainsi que la reconnaissance du fait que la proportion du génome représentée par des sites sélectivement contraints (où les mutations ont de faibles probabilités de fixation par dérive) dépend de la taille effective de la population de l’espèce ou de la région génomique (Ohta 1973). Tout en dérivant vers la fixation ou la perte, les mutations neutres et presque neutres contribuent à la variation de la séquence d’ADN au sein des populations. La théorie neutre émet en outre l’hypothèse que les mutations avantageuses sont suffisamment rares, par rapport à l’apport constant de variantes neutres et délétères, pour qu’elles soient rarement présentes dans des échantillons de variation ségrégante, en particulier en raison de leur propagation rapide à la fixation.

Ces idées ont considérablement changé la pensée des biologistes évolutionnistes. La dérive génétique a été prise beaucoup plus au sérieux qu’auparavant, stimulant un grand nombre de recherches empiriques fructueuses sur l’évolution et la variation moléculaires, ainsi que des avancées fondamentales dans la théorie stochastique de l’évolution, résumées dans le livre influent de Kimura (Kimura 1983). Il est maintenant difficile d’apprécier à quel point cette vision de l’évolution représentait un départ radical: dans les années 1950 et 1960, presque tous les changements évolutifs ont été attribués à la sélection naturelle directionnelle, et la plupart des polymorphismes avec des allèles à des fréquences intermédiaires ont été considérés comme maintenus en équilibrant la sélection (par exemple, Ford, 1975). Malgré ses contributions pionnières à la théorie génétique des populations stochastiques, Fisher a rejeté tout rôle évolutif important pour la dérive génétique (Fisher 1930), bien qu’il soit remarquable que Wright ait simultanément développé une profonde appréciation de l’importance de ces effets stochastiques qui a été justifiée plus tard lorsque les variantes moléculaires ont commencé à être étudiées (Wright 1931).

C’est dans ce contexte historique que Kern et Hahn (2018) discutent d’une prétendue controverse en génétique des populations concernant le pouvoir prédictif et l’applicabilité de la Théorie neutre, en commençant par la suggestion que « l’ubiquité de la variation adaptative à l’intérieur et entre les espèces signifie qu’une théorie plus complète de l’évolution moléculaire doit être recherchée. »Bien que ceux qui ont initialement développé la Théorie Neutre n’aient pas prétendu que tous les changements de séquence sont neutres — en effet, Kimura lui—même a développé certaines des formulations théoriques les plus fondamentales de la sélection et de ses interactions avec la dérive génétique – Kern et Hahn (2018) soutiennent que les données modernes ont démoli les preuves originales soutenant la Théorie neutre. Ce n’est pas une nouvelle revendication. Par exemple, Gillespie a critiqué certains des arguments initiaux en faveur de la neutralité (par exemple, Gillespie 1991), et des points de vue presque identiques ont été exprimés dans Hahn (2008). La nouveauté des arguments de Kern et Hahn (2018) réside principalement dans leur accent mis sur les effets de la sélection sur les sites liés sur les modèles de variation au sein des génomes. En conséquence, nous nous concentrons principalement sur cet aspect de leur document. Comme il deviendra clair, un problème majeur avec les vues de Kern et Hahn provient de leur définition étroite de la Théorie neutre, qu’ils résument comme suit: « les différences entre les espèces sont dues à des substitutions neutres (et non à une évolution adaptative), et (….) les polymorphismes au sein des espèces sont non seulement neutres, mais ont également une dynamique dominée par l’équilibre mutation‐dérive.”

Pour étayer ce point de vue étroit, Kern et Hahn plaident pour des effets omniprésents de la sélection, s’appuyant largement sur un petit nombre d’études génomiques de population suggérant que jusqu’à 50% des substitutions de remplacement d’acides aminés chez la Drosophile sont adaptatives (voir, par exemple, la revue de Sella et al. 2009), qui, selon eux, contredit l’affirmation de Kimura (1968, 1983) et de King et Jukes (1969) selon laquelle la plupart de ces substitutions sont causées par une dérive génétique. Outre l’incertitude inhérente à ces estimations (discutée par Fay 2011), il est trompeur de les utiliser pour faire l’affirmation générale selon laquelle la Théorie neutre est insuffisante pour expliquer les modèles de variation et d’évolution à l’échelle du génome; ces fréquences inférées de substitutions adaptatives ne concernent principalement que la petite fraction du génome qui code pour les protéines (par exemple, < 2% du génome humain; voir Lander et al. 2001). Kern et Hahn exagèrent davantage l’omniprésence des substitutions adaptatives en mettant en évidence des études chez l’homme et les plantes qui se concentrent sur le sous-ensemble limité de gènes qui évoluent rapidement. La circularité impliquée dans l’ignorance de la grande majorité des substitutions neutres ou presque neutres à travers le génome, puis le rejet d’un rôle important pour la neutralité, ne justifie guère la nécessité de la « théorie de la sélection de l’évolution moléculaire” prônée par Hahn (2008).

Deuxièmement, en ce qui concerne les effets de la sélection sur des sites neutres ou quasi neutres liés, Kern et Hahn (2018) soulignent la corrélation positive bien établie entre les taux de recombinaison et les niveaux de variation observés chez plusieurs espèces (Cutter et Payseur 2013). Ils commencent par l’affirmation très forte que « ces résultats impliquent que presque aucun loci n’est exempt des effets de la sélection, dans aucun organisme. »Cette affirmation générale est injustifiée, étant donné qu’il existe relativement peu d’espèces pour lesquelles de telles données sont disponibles. Bien que cette corrélation (documentée pour la première fois chez Drosophila melanogaster par Begun et Aquadro 1992) suggère en effet que la sélection réduit la variation neutre aux sites liés par le processus d’auto-stop, les effets mutagènes de la recombinaison elle-même peuvent également contribuer à ce schéma (Pratto et al. 2014; Arbeithuber et coll. 2015). L’auto-stop peut impliquer à la fois des balayages sélectifs causés par la propagation de mutations favorables (Maynard Smith et Haigh, 1974) et l’élimination de variantes neutres étroitement liées à des mutations délétères — sélection de fond (Charlesworth et al. 1993; Charlesworth 2012). Dans une comparaison explicite entre des modèles de sélection purifiante généralisée sur des allèles faiblement délétères et une sélection positive récurrente sur des allèles bénéfiques, Lohmueller et al. (2011) ont trouvé un bien meilleur ajustement du premier au modèle observé chez l’homme (voir également Pouyet et al. 2018), tout comme Comeron (2014) pour Drosophila.

Fait important, les observations de génomes eucaryotes, y compris les humains et les souris, montrent que les niveaux de polymorphisme sont faibles dans le voisinage des séquences codantes ou non codantes conservées et augmentent à peu près de façon monotone loin d’elles (Cutter et Payseur 2013; Johri et al. 2017; Lynch et coll. 2017). Alors que les balayages sélectifs peuvent contribuer à ce modèle, et sont en effet nécessaires pour expliquer d’autres observations (Campos et al. 2017), ces résultats impliquent que tout balayage sélectif impliqué doit avoir des effets plutôt locaux. Malgré ces résultats, Kern et Hahn (2018) mettent l’accent sur des études qui invoquent une sélection positive omniprésente pour expliquer les modèles de variation à l’échelle du génome (par exemple, Garud et al. 2015; Schrider et Kern 2017). Cependant, ces effets revendiqués doivent être évalués avec prudence, car ils n’excluent pas ou ne tiennent pas dûment compte des effets des histoires démographiques (inconnues) non équilibrées des populations en question.

Indépendamment de l’interaction précise des deux formes d’auto-stop, la sélection en arrière-plan et les balayages sélectifs, dans la formation des modèles de variation, il est important de noter qu’aucune n’affecte la probabilité de fixation de mutations neutres (Birky et Walsh 1988), qui détermine le taux d’évolution de la séquence neutre. Les deux modèles sont fondés sur des preuves solides que la grande majorité des variations de ségrégation est neutre ou presque neutre, et aucun des deux modèles ne contredit la preuve que la grande majorité des différences fixes entre les populations et les espèces sont également neutres ou presque neutres. De plus, la sélection de fond et les balayages sélectifs peuvent être considérés comme réduisant la taille effective de la population (Ne) des régions génomiques affectées, du moins en première approximation (voir Charlesworth, 2009). Comme le montrent Kimura et Ohta (Kimura et Ohta 1971; Ohta 1973; Kimura 1983), une réduction de Ne fait que rapprocher les probabilités de fixation des mutations à effets sélectifs de celles des mutations neutres, de sorte que le taux de fixation des mutations bénéfiques est réduit et que le taux de fixation des mutations délétères est augmenté — augmentant ainsi la fraction des mutations qui se comportent comme effectivement neutres. Ainsi, ces effets d’auto-stop ne font que souligner davantage le rôle évolutif fondamental de la dérive génétique. Bien que les premières formulations de la Théorie neutre se soient concentrées sur la dynamique des loci individuels et que les effets de la sélection sur la réduction des valeurs Ne à des loci liés n’aient pas été étudiés, nous n’aurions pas pu comprendre ces modèles sans les contributions de Kimura et Ohta. Il s’agit simplement d’une incompréhension du rôle des modèles théoriques dans l’éclairage de l’interprétation des données pour affirmer, comme le font Kern et Hahn (2018), que les effets de l’auto‐stop impliquent que les niveaux de polymorphisme ne sont pas à l’équilibre mutation-dérive, et « par conséquent, les données actuelles semblent fondamentalement incompatibles avec la théorie neutre. »

Compte tenu de ces considérations, nous proposons ici une interprétation simple des preuves existantes en termes de version moderne de la Théorie neutre, dont les composantes individuelles ne devraient pas être controversées:

  • (1)

    Une grande partie du génome des organismes étudiés à ce jour est soumise à des mutations qui sont effectivement neutres en ce qui concerne leurs effets sur la forme physique, et évoluent donc sous la dérive génétique.

  • (2)

    La grande majorité des mutations nouvellement apparues qui affectent la fitness (c.-à-d. les mutations non neutres) sont délétères, et le mode prédominant de sélection naturelle est la purification dans la nature, éliminant ces mutations délétères des populations.

  • (3)

    Les populations naturelles sont rarement à l’équilibre démographique et ont généralement subi des changements historiques récents. Les effets combinés des changements de taille, de structure et de migration des populations façonnent tous les modèles de variation intra‐espèce. On ne peut pas supposer que ces histoires démographiques affectent uniformément les modèles de variation à travers le génome et peuvent en effet produire des effets différents dans différentes régions génomiques, imitant les attentes sous sélection (par exemple, Wall et al. 2002; Thornton et Jensen 2007).

  • (4)

    Une combinaison de dérive génétique (telle que modulée par l’histoire démographique de la population) avec une sélection purifiante directe et liée façonne les modèles de variation génomique. Ainsi, un modèle prenant en compte conjointement tous ces effets est essentiel pour l’analyse génomique (Comeron 2017), et des progrès sont réalisés vers cet objectif (par exemple, Zeng et Charlesworth 2010).

  • (5)

    Des mutations bénéfiques apparaissent occasionnellement et certaines peuvent atteindre une fixation ou des fréquences élevées, et des effets d’auto-stop localisés liés à de tels événements ont été décrits de manière convaincante chez divers organismes. Dans certains cas, ces changements génotypiques ont été significativement liés à la fois au phénotype et à la forme physique. Cependant, les effets de ces événements de sélection positive localisés relativement rares sont mieux caractérisés et quantifiés comme s’ajoutant aux processus à l’échelle du génome décrits ci‐dessus (Stephan 2010). En l’absence d’un modèle nul approprié prenant en compte ces processus communs au génome dans son ensemble, une narration adaptative inappropriée sera susceptible de proliférer.

Les cinq points sont pleinement compatibles avec le travail révolutionnaire de Kimura et Ohta. De plus, les développements réalisés à la lumière des observations empiriques postérieures à la publication initiale de Kimura sont de simples extensions de la Théorie neutre. Ils démontrent son importance continue, plutôt que de le démolir. Au cours des cinq dernières décennies, de telles connaissances ont amélioré notre compréhension de l’interaction de la taille de la population avec la dynamique de sélection par dérive (Ohta, 1973) et décrit les effets auto‐stoppeurs de la sélection induits par la classe relativement rare de mutations bénéfiques (Maynard Smith et Haigh, 1974), ainsi que ceux causés par la classe beaucoup plus courante de mutations délétères (Charlesworth et al. 1993). Ce cadre a également servi de principe organisateur pour comprendre les modèles de variation de l’architecture génomique (Lynch 2007) et pour comprendre l’évolution des caractéristiques cellulaires, y compris le taux de mutation lui-même (Lynch et al. 2016).

Ainsi, notre utilisation du terme « révolutionnaire” pour décrire la Théorie neutre n’est pas censée impliquer une avancée scientifique pleinement formée au départ. Comme d’autres avancées scientifiques majeures, la Théorie neutre a été ajustée et modifiée au fil du temps à la lumière d’observations et de réflexions ultérieures, tout en conservant sa valeur. Par exemple, les découvertes et le raisonnement de Darwin soutenant le fonctionnement de la sélection naturelle n’ont pas été abandonnés en raison de son absence d’une théorie satisfaisante de l’hérédité — en effet, l’incorporation de ces connaissances ultérieures n’a fait que renforcer les concepts sous-jacents (Fisher 1930). De même, la Théorie neutre ne devrait pas être écartée en raison du manque d’accent mis sur les effets de la sélection sur des sites liés dans sa formulation initiale, car les études ultérieures n’ont fait que souligner le rôle fondamental de la quasi-neutralité et de la dérive génétique dans la formation de la variation observée au sein et entre les espèces. En effet, Ohta et Kimura ont été parmi les premiers à étudier de tels effets, dans leur analyse de la surdominance apparente sur des sites neutres induite par la liaison à des sites soumis à un avantage hétérozygote ou à une sélection contre des mutations délétères (Ohta et Kimura 1970; Ohta 1971).

En somme, la transition vers la biologie moléculaire a accru l’importance de la génétique des populations pour notre compréhension de l’évolution. De plus, au lieu de démêler le cadre théorique antérieur, l’afflux de données moléculaires a soutenu de nombreux développements théoriques pré‐génomiques. Bien que l’édifice ne soit peut-être pas encore complet, la théorie neutre a changé la façon dont les gens pensaient de l’évolution au niveau moléculaire, et ce cadre continue à servir de base à la génomique évolutive moderne. Ainsi, un grand crédit est dû aux scientifiques qui ont élaboré cette théorie en détail et anticipé une grande partie de ce qu’elle pourrait nous dire une fois que les gènes (et les génomes) pourraient être séquencés.