Articles

Cosa ci rende diversi?

Nove anni fa ho colto l’occasione per unirmi al team internazionale che stava identificando la sequenza di basi del DNA, o “lettere”, nel genoma dello scimpanzé comune (Pan troglodytes). Come biostatista con un interesse di lunga data per le origini umane, ero ansioso di allineare la sequenza del DNA umano accanto a quella del nostro parente vivente più vicino e fare un bilancio. È emersa una verità umiliante: i nostri progetti di DNA sono quasi identici al 99% al loro. Cioè, dei tre miliardi di lettere che compongono il genoma umano, solo 15 milioni di loro—meno dell ‘ 1 per cento—sono cambiati nei sei milioni di anni o giù di lì da quando i lignaggi umani e scimpanzé divergevano.

La teoria evolutiva sostiene che la stragrande maggioranza di questi cambiamenti ha avuto poco o nessun effetto sulla nostra biologia. Ma da qualche parte tra quei circa 15 milioni di basi laici le differenze che ci hanno reso umani. Ero determinato a trovarli. Da allora, io e altri abbiamo fatto progressi allettanti nell’identificare una serie di sequenze di DNA che ci distinguono dagli scimpanzé.

Una sorpresa precoce

Nonostante rappresentino solo una piccola percentuale del genoma umano, milioni di basi sono ancora un vasto territorio da cercare. Per facilitare la caccia, ho scritto un programma per computer che avrebbe la scansione del genoma umano per i pezzi di DNA che sono cambiati di più da quando gli esseri umani e scimpanzé divisi da un antenato comune. Poiché la maggior parte delle mutazioni genetiche casuali non giovano né danneggiano un organismo, si accumulano ad un ritmo costante che riflette la quantità di tempo trascorso da quando due specie viventi hanno avuto un antenato comune (questo tasso di cambiamento è spesso parlato come il “ticchettio dell’orologio molecolare”). L’accelerazione di quel tasso di cambiamento in alcune parti del genoma, al contrario, è un segno distintivo della selezione positiva, in cui le mutazioni che aiutano un organismo a sopravvivere e riprodursi hanno maggiori probabilità di essere trasmesse alle generazioni future. In altre parole, quelle parti del codice che hanno subito la maggior parte delle modifiche dalla scissione chimp-human sono le sequenze che molto probabilmente hanno modellato l’umanità.

Nel novembre 2004, dopo mesi di debug e ottimizzazione del mio programma per l’esecuzione su un massiccio cluster di computer presso l’Università della California, Santa Cruz, ho finalmente finito con un file che conteneva un elenco classificato di queste sequenze in rapida evoluzione. Con il mio mentore David Haussler appoggiato sopra la mia spalla, ho guardato il colpo superiore, un tratto di 118 basi che insieme divenne noto come human accelerated region 1 (HAR1). Utilizzando la U.C. Santa Cruz genome browser, uno strumento di visualizzazione che annota il genoma umano con informazioni provenienti da database pubblici, ho ingrandito HAR1. Il browser ha mostrato le sequenze HAR1 di un essere umano, scimpanzé, topo, ratto e pollo—tutte le specie di vertebrati i cui genomi erano stati decodificati da allora. Ha anche rivelato che precedenti esperimenti di screening su larga scala avevano rilevato l’attività HAR1 in due campioni di cellule cerebrali umane, sebbene nessuno scienziato avesse ancora nominato o studiato la sequenza. Abbiamo urlato: “Fantastico!”all’unisono quando abbiamo visto che HAR1 potrebbe essere parte di un gene nuovo per la scienza che è attivo nel cervello.

Avevamo colpito il jackpot. Il cervello umano è ben noto per differire notevolmente dal cervello scimpanzé in termini di dimensioni, organizzazione e complessità, tra gli altri tratti. Eppure i meccanismi evolutivi ed evolutivi alla base delle caratteristiche che distinguono il cervello umano sono poco conosciuti. HAR1 aveva il potenziale per illuminare questo aspetto più misterioso della biologia umana.

Abbiamo passato l’anno successivo a scoprire tutto ciò che potevamo sulla storia evolutiva di HAR1 confrontando questa regione del genoma in varie specie, tra cui altri 12 vertebrati che sono stati sequenziati durante quel periodo. Si scopre che fino a quando gli esseri umani sono arrivati, HAR1 si è evoluto estremamente lentamente. Nei polli e negli scimpanzé—i cui lignaggi divergevano circa 300 milioni di anni fa—solo due delle 118 basi differiscono, rispetto a 18 differenze tra umani e scimpanzé, i cui lignaggi divergevano molto più recentemente. Il fatto che HAR1 è stato essenzialmente congelato nel tempo attraverso centinaia di milioni di anni indica che fa qualcosa di molto importante; che poi ha subito una brusca revisione negli esseri umani suggerisce che questa funzione è stata significativamente modificata nel nostro lignaggio.

Un indizio critico sulla funzione di HAR1 nel cervello è emerso nel 2005, dopo che il mio collaboratore Pierre Vanderhaeghen della Libera Università di Bruxelles ha ottenuto una fiala di copie HAR1 dal nostro laboratorio durante una visita a Santa Cruz. Ha usato queste sequenze di DNA per progettare un tag molecolare fluorescente che si illuminerebbe quando HAR1 è stato attivato nelle cellule viventi-cioè, copiato dal DNA in RNA. Quando i geni tipici sono accesi in una cellula, la cellula prima fa una copia mobile dell’RNA messaggero e poi usa l’RNA come modello per sintetizzare alcune proteine necessarie. L’etichettatura ha rivelato che HAR1 è attivo in un tipo di neurone che svolge un ruolo chiave nel modello e nel layout della corteccia cerebrale in via di sviluppo, lo strato cerebrale più esterno rugoso. Quando le cose vanno male in questi neuroni, il risultato può essere un disturbo congenito grave, spesso mortale, noto come lissencefalia (”cervello liscio”), in cui la corteccia manca delle sue pieghe caratteristiche e presenta una superficie marcatamente ridotta. Malfunzionamenti in questi stessi neuroni sono anche legati all’insorgenza della schizofrenia in età adulta.

HAR1 è quindi attivo al momento giusto e nel posto giusto per essere strumentale nella formazione di una corteccia sana. (Altre prove suggeriscono che può inoltre svolgere un ruolo nella produzione di sperma. Ma esattamente come questo pezzo del codice genetico influenza lo sviluppo della corteccia è un mistero che io e i miei colleghi stiamo ancora cercando di risolvere. Siamo ansiosi di farlo: la recente raffica di sostituzioni di HAR1 potrebbe aver alterato significativamente il nostro cervello.

Oltre ad avere una notevole storia evolutiva, HAR1 è speciale perché non codifica una proteina. Per decenni, la ricerca di biologia molecolare si è concentrata quasi esclusivamente sui geni che specificano le proteine, i mattoni fondamentali delle cellule. Ma grazie al Progetto Genoma umano, che ha sequenziato il nostro genoma, gli scienziati ora sanno che i geni codificanti proteine costituiscono solo l ‘ 1,5% del nostro DNA. L’altro 98,5 per cento—a volte indicato come DNA spazzatura-contiene sequenze di regolamentazione che dicono altri geni quando accendere e spegnere e geni che codificano RNA che non ottiene tradotto in una proteina, così come un sacco di DNA avente scopi gli scienziati stanno solo cominciando a capire.

Sulla base di modelli nella sequenza HAR1, abbiamo predetto che HAR1 codifica RNA—una sensazione che Sofie Salama, Haller Igel e Manuel Ares, tutti a U. C. Santa Cruz, successivamente confermato nel 2006 attraverso esperimenti di laboratorio. In realtà, si scopre che HAR1 umano risiede in due geni sovrapposti. La sequenza HAR1 condivisa dà origine a un tipo completamente nuovo di struttura dell’RNA, che si aggiunge alle sei classi conosciute di geni dell’RNA. Questi sei gruppi principali comprendono più di 1.000 diverse famiglie di geni di RNA, ognuno distinto dalla struttura e dalla funzione dell’RNA codificato nella cellula. HAR1 è anche il primo esempio documentato di una sequenza di codifica RNA che sembra aver subito una selezione positiva.

Potrebbe sembrare sorprendente che nessuno abbia prestato attenzione a queste incredibili 118 basi del genoma umano in precedenza. Ma in assenza di tecnologia per confrontare facilmente genomi interi, i ricercatori non avevano modo di sapere che HAR1 era più di un semplice pezzo di DNA spazzatura.

Indizi linguistici

I confronti dell’intero genoma in altre specie hanno anche fornito un’altra intuizione cruciale sul motivo per cui gli esseri umani e gli scimpanzé possono essere così diversi nonostante siano molto simili nei loro genomi. Nell’ultimo decennio i genomi di migliaia di specie (per lo più microbi) sono stati sequenziati. Si scopre che dove le sostituzioni del DNA si verificano nel genoma-piuttosto che quanti cambiamenti sorgono nel complesso-può importare molto. In altre parole, non è necessario cambiare molto del genoma per creare una nuova specie. Il modo per evolvere un essere umano da un antenato scimpanzé-umano non è quello di accelerare il ticchettio dell’orologio molecolare nel suo complesso. Piuttosto il segreto è quello di avere rapido cambiamento si verificano in siti in cui tali cambiamenti fanno una differenza importante nel funzionamento di un organismo.

HAR1 è certamente un posto del genere. Così, anche, è il gene FOXP2, che contiene un’altra delle sequenze in rapida evoluzione che ho identificato ed è noto per essere coinvolto nella parola. Il suo ruolo nel linguaggio è stato scoperto dai ricercatori dell’Università di Oxford, che hanno riferito nel 2001 che le persone con mutazioni nel gene non sono in grado di fare certi movimenti facciali sottili e ad alta velocità necessari per il normale linguaggio umano, anche se possiedono la capacità cognitiva di elaborare il linguaggio. La tipica sequenza umana mostra diverse differenze rispetto a quella dello scimpanzé: due sostituzioni di base che hanno alterato il suo prodotto proteico e molte altre sostituzioni che possono aver portato a cambiamenti che influenzano come, quando e dove la proteina viene utilizzata nel corpo umano.

Una scoperta ha fatto luce su quando la versione vocale di FOXP2 è apparsa negli ominidi: nel 2007 gli scienziati del Max Planck Institute for Evolutionary Anthropology di Lipsia hanno sequenziato FOXP2 estratto da un fossile di Neandertal e hanno scoperto che questi umani estinti avevano la versione umana moderna del gene, forse permettendo loro di enunciare come facciamo noi. Le stime attuali per quando i lignaggi umani di Neandertal e moderni si sono divisi suggeriscono che la nuova forma di FOXP2 deve essere emersa almeno mezzo milione di anni fa. La maggior parte di ciò che distingue il linguaggio umano dalla comunicazione vocale in altre specie, tuttavia, non deriva dai mezzi fisici ma dalle capacità cognitive, che sono spesso correlate alle dimensioni del cervello. I primati hanno generalmente un cervello più grande di quanto ci si aspetterebbe dalla loro dimensione corporea. Ma il volume del cervello umano è più che triplicato da quando lo scimpanzé-antenato umano – uno scatto di crescita che i ricercatori di genetica hanno solo iniziato a svelare.

Uno degli esempi meglio studiati di un gene legato alle dimensioni del cervello negli esseri umani e in altri animali è ASPM. Studi genetici di persone con una condizione nota come microcefalia, in cui il cervello è ridotto fino al 70%, hanno scoperto il ruolo di ASPM e di un altro gene—CDK5RAP2—nel controllo delle dimensioni del cervello. Più recentemente, i ricercatori dell’Università di Chicago, dell’Università del Michigan e dell’Università di Cambridge hanno dimostrato che ASPM ha sperimentato diverse esplosioni di cambiamento nel corso dell’evoluzione dei primati, un modello indicativo di selezione positiva. Almeno una di queste esplosioni si è verificata nel lignaggio umano poiché divergeva da quello degli scimpanzé e quindi era potenzialmente strumentale nell’evoluzione dei nostri grandi cervelli.

Altre parti del genoma potrebbero aver influenzato meno direttamente la metamorfosi del cervello umano. La scansione del computer che ha identificato HAR1 ha anche trovato altre 201 regioni accelerate umane, la maggior parte delle quali non codificano proteine o addirittura RNA. (Uno studio correlato condotto presso il Wellcome Trust Sanger Institute di Cambridge, in Inghilterra, ha rilevato molti degli stessi HARs.) Invece sembrano essere sequenze regolatorie che dicono i geni vicini quando accendere e spegnere. Sorprendentemente, più della metà dei geni situati vicino a HARs sono coinvolti nello sviluppo e nella funzione del cervello. E, come è vero per FOXP2, i prodotti di molti di questi geni vanno a regolare altri geni. Così, anche se HARs costituiscono una porzione minuto del genoma, cambiamenti in queste regioni avrebbero potuto profondamente alterato il cervello umano influenzando l’attività di intere reti di geni.

Al di là del cervello

Anche se molte ricerche genetiche si sono concentrate sul chiarire l’evoluzione del nostro cervello sofisticato, gli investigatori hanno anche messo insieme come altri aspetti unici del corpo umano sono venuti ad essere. HAR2, una regione di regolazione del gene e il secondo sito più accelerato sulla mia lista, è un esempio calzante. Nel 2008 i ricercatori del Lawrence Berkeley National Laboratory hanno dimostrato che specifiche differenze di base nella versione umana di HAR2 (noto anche come HACNS1), rispetto alla versione nei primati non umani, consentono a questa sequenza di DNA di guidare l’attività genica nel polso e nel pollice durante lo sviluppo fetale, mentre la versione ancestrale in altri primati non può. Questa scoperta è particolarmente provocatoria perché potrebbe sostenere cambiamenti morfologici nella mano umana che hanno permesso la destrezza necessaria per fabbricare e utilizzare strumenti complessi.

Oltre a subire cambiamenti nella forma, i nostri antenati hanno subito anche cambiamenti comportamentali e fisiologici che li hanno aiutati ad adattarsi alle circostanze alterate e migrare in nuovi ambienti. Ad esempio, la conquista del fuoco più di un milione di anni fa e la rivoluzione agricola di circa 10.000 anni fa hanno reso più accessibili i cibi ricchi di amido. Ma i cambiamenti culturali da soli non erano sufficienti per sfruttare questi comestibles ricchi di calorie. I nostri predecessori hanno dovuto adattarsi geneticamente a loro.

I cambiamenti nel gene AMY1, che codifica l’amilasi salivare, un enzima coinvolto nella digestione dell’amido, costituiscono un adattamento ben noto di questo tipo. Il genoma dei mammiferi contiene più copie di questo gene, con il numero di copie che varia tra le specie e anche tra i singoli esseri umani. Ma nel complesso, rispetto ad altri primati, gli esseri umani hanno un numero particolarmente elevato di copie AMY1. Nel 2007 i genetisti dell’Arizona State University hanno dimostrato che gli individui che trasportano più copie di AMY1 hanno più amilasi nella loro saliva, consentendo loro di digerire più amido. L’evoluzione di AMY1 sembra quindi coinvolgere sia il numero di copie del gene che i cambiamenti specifici nella sua sequenza di DNA.

Un altro famoso esempio di adattamento alimentare coinvolge il gene per la lattasi (LCT), un enzima che permette ai mammiferi di digerire il lattosio carboidrato, noto anche come zucchero del latte. Nella maggior parte delle specie, solo i bambini che allattano possono elaborare il lattosio. Ma circa 9.000 anni fa-molto recentemente, in termini evolutivi-i cambiamenti nel genoma umano hanno prodotto versioni di LCT che hanno permesso agli adulti di digerire il lattosio. LCT modificato si è evoluto indipendentemente nelle popolazioni europee e africane, consentendo ai portatori di digerire il latte dagli animali domestici. Oggi i discendenti adulti di questi antichi pastori sono molto più propensi a tollerare il lattosio nella loro dieta rispetto agli adulti di altre parti del mondo, tra cui Asia e America Latina, molti dei quali sono intolleranti al lattosio a causa della versione ancestrale del gene primate.

LCT non è l’unico gene noto per essere in evoluzione negli esseri umani in questo momento. Il progetto genoma chimp identificato 15 altri nel processo di spostamento lontano da una versione che era perfettamente normale nei nostri antenati scimmia e che funziona bene in altri mammiferi, ma, in quella vecchia forma, è associato a malattie come l’Alzheimer e il cancro negli esseri umani moderni. Molti di questi disturbi affliggono gli esseri umani da soli o si verificano a tassi più elevati negli esseri umani che in altri primati. Gli scienziati stanno studiando le funzioni dei geni coinvolti nel tentativo di stabilire perché le versioni ancestrali di questi geni sono diventate disadattive in noi. Questi studi potrebbero aiutare i medici a identificare quei pazienti che hanno una maggiore probabilità di contrarre una di queste malattie potenzialmente letali, nella speranza di aiutarli a prevenire la malattia. Gli studi possono anche aiutare i ricercatori a sviluppare nuovi trattamenti.

Con il bene arriva il male

Quando i ricercatori esaminano il genoma umano per prove di selezione positiva, i migliori candidati sono spesso coinvolti nell’immunità. Non sorprende che l’evoluzione armeggi così tanto con questi geni: in assenza di antibiotici e vaccini, l’ostacolo più probabile per gli individui che passano lungo i loro geni sarebbe probabilmente un’infezione pericolosa per la vita che colpisce prima della fine dei loro anni di gravidanza. Accelerare ulteriormente l’evoluzione del sistema immunitario è il costante adattamento dei patogeni alle nostre difese, portando a una corsa agli armamenti evolutiva tra microbi e ospiti.

I record di queste lotte sono lasciati nel nostro DNA. Ciò è particolarmente vero per i retrovirus, come l’HIV, che sopravvivono e si propagano inserendo il loro materiale genetico nei nostri genomi. Il DNA umano è disseminato di copie di questi brevi genomi retrovirali, molti da virus che hanno causato malattie milioni di anni fa e che potrebbero non circolare più. Nel tempo le sequenze retrovirali accumulano mutazioni casuali proprio come qualsiasi altra sequenza, in modo che le diverse copie siano simili ma non identiche. Esaminando la quantità di divergenza tra queste copie, i ricercatori possono utilizzare tecniche di orologio molecolare per datare l’infezione retrovirale originale. Le cicatrici di queste antiche infezioni sono visibili anche nei geni del sistema immunitario ospite che si adattano costantemente per combattere i retrovirus in continua evoluzione.

PtERV1 è uno di questi virus reliquia. Negli esseri umani moderni, una proteina chiamata TRIM5a agisce per impedire la replicazione dello PtERV1 e dei retrovirus correlati. L’evidenza genetica suggerisce che un’epidemia di PtERV1 afflisse antichi scimpanzé, gorilla e umani che vivevano in Africa circa quattro milioni di anni fa. Per studiare come diversi primati hanno risposto a PtERV1, nel 2007 i ricercatori del Fred Hutchinson Cancer Research Center di Seattle hanno utilizzato le molte copie mutate casualmente di PtERV1 nel genoma dello scimpanzé per ricostruire la sequenza originale di PtERV1 e ricreare questo antico retrovirus. Hanno quindi eseguito esperimenti per vedere quanto bene le versioni umane e grandi scimmie del gene TRIM5a potrebbero limitare l’attività del virus PTERV1 risorto. I loro risultati indicano che molto probabilmente un singolo cambiamento nel TRIM5a umano ha permesso ai nostri antenati di combattere l’infezione da PtERV1 in modo più efficace di quanto potrebbero fare i nostri cugini primati.

Sconfiggere un tipo di retrovirus non garantisce necessariamente un successo continuo contro gli altri, tuttavia. Anche se i cambiamenti nel TRIM5a umano potrebbero averci aiutato a sopravvivere allo PtERV1, questi stessi cambiamenti rendono molto più difficile per noi combattere l’HIV. Questa scoperta sta aiutando i ricercatori a capire perché l’infezione da HIV porta all’AIDS negli esseri umani, ma meno frequentemente lo fa nei primati non umani. È chiaro che l’evoluzione può fare un passo avanti e due indietro. A volte la ricerca scientifica si sente allo stesso modo. Abbiamo identificato molti candidati interessanti per spiegare la base genetica dei tratti umani distintivi. Nella maggior parte dei casi, però, sappiamo solo le basi circa la funzione di queste sequenze del genoma. Le lacune nella nostra conoscenza sono particolarmente grandi per regioni come HAR1 e HAR2 che non codificano le proteine.

Queste sequenze in rapida evoluzione indicano una via da seguire. La storia di ciò che ci ha resi umani probabilmente non si concentrerà sui cambiamenti nei nostri blocchi di proteine, ma piuttosto su come l’evoluzione ha assemblato questi blocchi in modi nuovi cambiando quando e dove nel corpo diversi geni si accendono e si spengono. Studi sperimentali e computazionali ora in corso in migliaia di laboratori in tutto il mondo promettono di chiarire cosa sta succedendo nel 98,5 per cento del nostro genoma che non codifica per le proteine. Si sta cercando sempre meno come spazzatura ogni giorno.