Articles

Genome-wide association mapping of date palm fruit traits

sekwencjonowanie genomu mężczyzny BC4

próbowaliśmy samca backcross date palm zlokalizowanego w Departamencie Rolnictwa Stanów Zjednoczonych (USDA)/University of California, Riverside farm w Thermal, Kalifornia (USDA accession No. PI 555415, źródło RIV 7545 PL). Samiec ten został wyprodukowany przez cztery generacje krzyżowania wstecznego z samicą Barhee jako powracającym rodzicem w ramach programu hodowlanego w USDA w USA, który został przerwany w latach 70. Ulotki zostały oczyszczone i zamrożone na ciekłym azocie przed transportem do Arizona Genomics Institute (University of Arizona, Tucson, AZ) w celu ekstrakcji DNA o wysokiej masie cząsteczkowej i sekwencjonowania.

Genom mężczyzny BC4 zsekwencjonowano za pomocą platformy sekwencjonującej PacBio Rsii. DNA o dużej masie cząsteczkowej do sekwencjonowania ekstrahowano z młodych liści, przyjmując protokół Doyle ’ a i Doyle42 z niewielkimi modyfikacjami. Przygotowanie biblioteki PacBio przebiegało zgodnie z protokołem 20 kb i zbudowano trzy biblioteki (20, 25 i 30 kb). Osiemdziesiąt pięć komórek SMRT zostało zsekwencjonowanych na sekwencerie RSII z czasem zbierania filmów wynoszącym 6 h. wygenerowano około 6,4 miliona odczytów, co daje łącznie 72 GB danych (średnia długość podczytania 11,2 kb, N50 18,5 kb). Dodatkowe sekwencjonowanie krótkiej biblioteki insert (2 × 100 bp paired-end) przeprowadzono za pomocą sekwencera Illumina HiSeq 2500.

montaż genomu

wykonaliśmy oszacowanie wielkości genomu na podstawie k-mer z surowych krótkich sekwencji męskiego genomu BC4 do celów montażu (KmerFreq_AR w soapdenovo243) z ustawieniami domyślnymi i długością k-mer ustawioną na 17. Należy zauważyć, że eksperymentalne oszacowanie wielkości genomu dla P. dactylifera przeprowadzono również przy użyciu cytometrii przepływowej (patrz poniżej). Czytniki PacBio zostały następnie zmontowane z FALCON-Unzip19 (v. falcon-2017.06.28–18.01-py2.7-ucs2) o pokryciu nasion 55× i szacowanej wielkości genomu na podstawie k-mer 774 Mb jako danych wejściowych. Moduł rozpakowywania został uruchomiony z ustawieniami domyślnymi.

powstały zespół został wypolerowany przez wyrównanie raw czytników PacBio za pomocą kołczanu i strzałki (część pakietu SMRT Analysis suite v.2.3.0), a następnie uruchomienie Pilon44 V. 1.18 z krótkimi sekwencjami odczytu Illumina z męskiego BC4. Wejścia do Pilonu uzyskano przez przycięcie krótkiego odczytu za pomocą Trimmomatic45 (V. 0. 32) w celu usunięcia 3′ zasad poniżej jakości zasad Q30 i odczytu krótszego niż 30 nukleotydów. Odczyty zostały następnie wyrównane do wyjścia Arrow z Bowtie246 (V.2.2.6).

wypolerowane stygi pierwotne zostały zakotwiczone w LGs istniejącej mapy genetycznej21 z ALLMAPS22 w celu wytworzenia zakotwiczonego zespołu haploidalnego. Sekwencje rusztowań dla mapy genetycznej uzyskano z http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gz. Po dopasowaniu do mapy genetycznej i po ręcznej kontroli dostosowania surowych odczytów do montażu, znaleźliśmy tylko jeden przypadek błędnego montażu: jeden contig musiał zostać podzielony, ponieważ dwa końce contiga zostały połączone head-to-head.

adnotacja genomu

wygenerowaliśmy biblioteki RNA-Seq z wielu owoców fazy khalal (patrz poniżej), mieszaniny męskich i żeńskich pąków kwiatowych (zwanych poniżej „kwiatem”) i pyłku i przeprowadziliśmy sekwencjonowanie końcowe 2 × 100 bp na instrumencie Illumina HiSeq 2500 (dodatkowa Tabela 7). Dodatkowe dane RNA-Seq z liści i korzenia Pobrano z archiwum odczytu sekwencji (dodatkowa Tabela 7). Odczyty RNA-Seq przycinano za pomocą Trimmomatic45, wyrównywano do haploidalnego montażu za pomocą STAR47 (V. 2. 4.0.1) i modeli genów przewidywanych przez StringTie48 (V. 1. 3.2) do wykorzystania jako szkolenie dla Augustus49 (v. 2.3).

adnotację genu przeprowadzono przy użyciu pipeliny MAKER250 (V.2. 31). Dowody oparte na homologii obejmowały 7097 est (pobrane z bazy danych NCBI EST w dniu 9 lutego 2017 r.), sekwencje białek z Uniprot51 , proteomu palmy daktylowej, proteomu palmy olejowej52 i modeli pochodnych RNA-Seq z góry. Przewidywanie Ab initio przeprowadzono z Augustusem (V.3.0) wyszkolonym zgodnie z opisem w Bowman et al.53 z modelami genów wytworzonymi za pomocą StringTie48 (v. 1.3.2), z wyrównań RNA-Seq.

adnotacja raw MAKER2 została przeanalizowana, usuwając modele zawierające domeny TE i pozbawione dowodów transkrypcji lub obecności domeny Pfam, jak opisano w Bowman et al.53. Z około 1× nie-organellar single-end WGS Illumina odczytuje, de novo (non assembly-based) repeat library was produced with RepeatExplorer54, and parsed as in Copetti et al.55. Repeat Masker (V.4. 0. 6; w przestrzeni nukleotydowej) i Blaster56 (część pakietu REPET v 2.5, w przestrzeni proteinowej), a następnie uzgadniany w jednym pliku adnotacji. Noncoding RNA przewidywano za pomocą Infernal57 (V.1.1.2) z biblioteką Rfam58 (V. 12.2). Odsłony powyżej progu wartości e wynoszącego 1 × 10-5 zostały odfiltrowane, a także wyniki z wynikiem niższym niż próg zbierania specyficznego dla rodziny. Gdy przewidywano loci na obu pasmach, utrzymywano tylko trafienie z najwyższym wynikiem. Transfer RNA przewidywano również przy użyciu tRNAscan-SE59 (V. 2. 0) z domyślnymi parametrami.

ocena jakości genomu

wizualizacje zespołu genomu zostały wykonane za pomocą oprogramowania assembly-stats (dodatkowe rys. 1, ). Kompletność montażu oceniano przez scharakteryzowanie przestrzeni genowej z BUSCO20 przy użyciu 1440 roślinnych grup ortologowych (v. 3) i przez dostosowanie est do zespołu diploidalnego z Blat60 (v. 350).

szacowanie wielkości genomu palmy daty

wielkość genomu oszacowano przy użyciu jednoetapowej procedury cytometrii przepływowej opisanej w Doležel i wsp.61 z niewielkimi modyfikacjami. Krótko, około 1 cm2 materiału liściowego z dwóch P. próbki dactylifera z kolekcji Royal Botanic Gardens, Kew, UK inkubowano przez 30 s na lodzie w 1 ml „buforu ogólnego przeznaczenia” (GPB) 62 uzupełnionego 3% PVP-40 w celu zmiękczenia liścia. Następnie podobna ilość materiału liściowego wzorca Petroselinum crispum (Mill.)Dodano Fuss (wartość 1C = 2201 Mb) 63, A połączony materiał siekano szybko (ale nie zbyt energicznie) za pomocą nowej żyletki. Dodano kolejny 1 ml buforu GPB, a następnie homogeniat przesączono przez siatkę nylonową 30 µm (Celltrics 30 µM mesh, Sysmex, Goritz, Niemcy) do probówki, dodano 100 µl jodku propidium (1 mg/mL) i próbkę inkubowano na lodzie przez 10 minut. Względną fluorescencję 5000 cząstek zarejestrowano za pomocą Cytometru przepływowego Partec Cyflow SL3 (Partec GmbH, Münster, Niemcy) wyposażonego w laser półprzewodnikowy zielony o mocy 100 mW (532 nm, Cobolt Samba, Solna, Szwecja). Przetwarzano trzy replikaty każdego liścia, a wyjściowe histogramy analizowano za pomocą oprogramowania FlowMax V. 2.4 (Partec GmbH). Wartość 1C P. dactylifera (Mbp) obliczono jako: (średnia pozycja piku P. dactylifera/średnia pozycja piku P. crispum) × 2201 Mb (=wartość 1C P. crispum)63.

panel GWAS

fenotypowanie GWAS przeprowadzono na palmach daktylowych zlokalizowanych w dwóch gospodarstwach w Zjednoczonych Emiratach Arabskich. Farmy znajdują się w Centrum Badawczym Date Palm w Hamriyah, Ras Al-Khaimah (N = 46) i w Al-Shuwaib, Al-Ain, Abu Dhabi (N = 111) . Populacja składa się głównie z żeńskich odmian handlowych (n = 145). Samce (N = 12) rosnące na farmach były również sekwencjonowane głównie w celu mapowania miejsca determinującego płeć.

próbki owoców w fazie Khalal zostały pobrane od wiosny do jesieni w 2016 r.i albo zamrożone na ciekłym azocie do sekwencjonowania RNA, albo zebrane jako świeże owoce do fotografii, skanowania (patrz poniżej) i charakteryzowania innych cech owoców. Latem 2017 roku zebrano owoce Tamar stage z tych samych drzew w celu profilowania cukrów i kwasów organicznych. Próbki liści pobrano do ekstrakcji DNA i sekwencjonowania genomu.

genomowe DNA ekstrahowano z tkanki mezokarpa/epikarpa liściowego lub owocowego za pomocą Mini kit dneasy (Qiagen, Venlo, Holandia). Kolumny do ekstrakcji DNA oraz biblioteki przygotowane przy użyciu zestawu Illumina Nextera (San Diego, CA). Sekwencjonowanie końcowe 2 × 100 bp zostało przeprowadzone na sekwencerie Illumina HiSeq 2500 z maksymalnie ośmioma bibliotekami na pas. Odczyty zostały zdemultipleksowane, a te przechodzące filtry kontroli jakości Illumina zostały przetworzone za pomocą Trimmomatic45 (V. 0. 36) W celu usunięcia sekwencji adapterów zanieczyszczających. Do usunięcia adaptera użyliśmy bazy danych adaptera i NextEra transposase Sequence dołączonej do pobrania Trimmomatic (V. 0. 32) z następującym ustawieniem ILLUMINACLIP:〈biblioteka adapterów〉:2:30:10 MINLEN:76, aby zachować tylko pary odczytu, w których oba odczyty były 76 bps lub dłuższe po przycięciu.

odczyty zostały dopasowane do zdemaskowanego zespołu męskiego BC4 (tylko podstawowe styki) przy użyciu bwa mem (V.0. 7. 15-r1140). Aligner BWA mem został uruchomiony z opcją-M, aby oznaczyć dodatkowe odczyty (flaga bitowa 0 × 800) jako drugorzędne (0 × 100). Przykładowe wyrównania zostały przetworzone za pomocą FixMateInformation (Picard-tools V.2.8.2; http://broadinstitute.github.io/picard), aby zapewnić spójność sparowanych informacji odczytu, SamSort (Picard-tools V. 2.8.2) do koordynowania sortowania wyrównań, MarkDuplicates (Picard-tools V. 2.8.2) do oznaczania zduplikowanych par odczytu oraz za pomocą GATK64 IndelRealignerTargetCreator/IndelRealigner narzędzie (gatk v. 3.7-0) do wyrównywania odczytów w regionach INDEL. Przykładowe wyrównania były sprawdzane na każdym etapie przy użyciu ValidateSam (Picard-tools V. 2.8.2), aby zapewnić brak błędów w produkcji. Przetworzone dopasowania zostały podsumowane za pomocą CollectAlignmentSummaryMetrics (Picard-tools V .2.8.2) i Samtools.

wywołanie SNP i genotypowanie

wywołanie SNP i genotypowanie zostało przeprowadzone za pomocą HaplotypeCaller gatk (V .3. 7-0) w trybie gvcf, a następnie wspólne genotypowanie z Genotypegvcf. Odczyty filtrowano z etapu HaplotypeCaller, aby wykluczyć te o jakości mapowania mniejszej niż 20 i wykluczyć te oznaczone jako duplikaty łańcuchowej reakcji polimerazy (PCR) lub wtórne wyrównania (patrz wyżej). Takie podejście dało 32 384 028 SNP we wszystkich próbkach. Filtrowanie SNP zostało przeprowadzone przez zastosowanie twardych filtrów do surowych wariantów przy użyciu GATK V. 4.0.2.1. Przefiltrowaliśmy zestaw wywołań raw, aby wykluczyć SNP z niskim (<785) i wysokim głębokością (>2862) sumowanym w próbkach. Wykluczyliśmy również wielowątkowe SNP, SNP w obrębie 10 bp polimorfizmów indel oraz SNP spełniające następujące warunki: QUAL < 30 i QD < 5.0. Genotypy uznano za brakujące, jeśli DP było poniżej 5 lub powyżej 20, jak również SNP o współczynniku wywołania genotypu < 80%, lub o mniejszej częstości alleli poniżej 0,01. Oszacowaliśmy wartość P dla każdego miejsca z testu równowagi Hardy ’ ego–Weinberga przy użyciu VCFtools65 i odfiltrowaliśmy SNP wykazujące nadmiar heterozygotyczności (dokładny test, p < 0,05). Ta procedura dała filtrowany zestaw połączeń 7,149,205 SNPs.

analiza statystyczna

wszystkie analizy statystyczne przeprowadzono w języku r statistical computing, o ile nie zaznaczono inaczej.

analiza LD

oszacowano LD przy użyciu metody szacowania r2, która jest odpowiednia dla danych bez fazy (patrz VCFtools65). Krzywa rozpadu LD dla panelu GWAS została obliczona jak w Flowers et al.4. Krótko mówiąc, R2 obliczono dla bezfazowych SNP z częstością drobnych alleli większą niż 10% przy użyciu opcji-geno-ld w VCFtools (v. 0.1.14). Krzywe rozpadu zostały wygenerowane przez dopasowanie krzywej do parzystych szacunków r2 przez fizyczną odległość między parami SNP z nieliniowymi najmniejszymi kwadratami przy użyciu podejścia dostosowanego do Marroni et al.66. Odległość połowicznego rozpadu została następnie obliczona jako odległość, przy której r2 jest o połowę jego wartością maksymalną (tj. odległość 1 bp).

charakterystyka koloru owoców

zebrano osiem owoców khalal Stadium wolnych od obrażeń na odmianę palmy daktylowej, przepłukano wodą z kranu w celu usunięcia kurzu, a następnie wysuszono na powietrzu. Owoce były krojone wzdłużnie, a kolor owoców był następnie mierzony za pomocą dwóch strategii. Najpierw sfotografowaliśmy pokrojone owoce za pomocą sprawdzarki kolorów w pudełku camera photo studio, gdzie zdjęcia zostały wykonane na białym tle aparatem cyfrowym. Kolor owoców analizowano za pomocą oprogramowania Imagej67 przy użyciu parametrów kolorów RGB.

Po Drugie, zastosowaliśmy podejście komplementarne, gdzie użyliśmy oprogramowania Tomato Analyzer 68 V.2.2 do uzyskania szacunków parametrów kolorów L*, A*, b*. Współrzędna L * wyraża ciemność i lekkość koloru i waha się od czerni (0) do bieli (100). Współrzędne a* i b * wyrażają kierunek koloru, gdzie +A * jest w kierunku czerwonym, −a* w kierunku zielonym, +b* w kierunku żółtym i-b* w kierunku niebieskim68. Pozyskiwanie i analiza obrazu została wykonana zgodnie z opisem w Rodríguez et al.27. Pokrojone owoce umieszczano na skanerze z czarnym tłem i przykrywano, aby uniknąć efektów światła otoczenia. Zeskanowane zdjęcia zostały zapisane jako pliki JPEG, a szacunkowe parametry kolorów L*, A*, b * zostały wykonane na każdym owocu. Obliczono średnią wszystkich owoców. Obie metody były silnie skorelowane, więc użyliśmy wskaźnika koloru a* / b * w celu oceny różnic w kolorach skóry owoców i wykorzystaliśmy go do badania asocjacji.

zawartość antocyjanów w owocach

całkowitą antocyjaninę ekstrahowano z trzech replikatów owoców stopnia khalal z każdej odmiany palmy daktylowej przy użyciu owoców zamrożonych snap na ciekłym azocie zgodnie z procedurą opisaną w Rabino i Mancinelli69 z niewielką modyfikacją. Krótko mówiąc, antocyjaninę z mrożonej skórki owoców (100 mg) mielono na drobny proszek i ekstrahowano w 1 ml kwaśnego metanolu (1% HCl) przez inkubację w temperaturze pokojowej w ciemności przez 18 godzin, a następnie odwirowywano przez 10 minut w temperaturze 12 000 g. Kwantyfikację całkowitej antocyjaniny przeprowadzono przy użyciu absorbancji mierzonej spektrofotometrem z zastosowaniem równania

całkowita antocyjanina = (A530-0,25 × A657)/FW, gdzie A530 i A657 nm to absorbancja, a FW to mokra masa materiału roślinnego (g).

Rozmiar owoców

zdjęcia owoców używane do analizy kolorów (patrz wyżej) zawierały linijkę jako standard rozmiaru. ImageJ67 (V. 2) i Tomato analyzer27 zostały następnie wykorzystane do oszacowania długości i szerokości owoców.

zawartość cukru i kwasu w owocach

sacharoza, glukoza i fruktoza oznaczono ilościowo ze 125 odmian na etapie Tamar, kiedy owoce są suche, dojrzewanie jest zakończone i etap, w którym zwykle spożywane są daktyle. Owoce mrożono błyskawicznie w temperaturze -20 °C i od 10 do 15 owoców na odmianę natychmiast utrzymywano w temperaturze -20 °C przez przybycie do Montpellier (francuskiego Centrum Badań Rolniczych Na Rzecz Rozwoju Międzynarodowego, CIRAD), gdzie przeprowadzono analizę wysokosprawnej chromatografii cieczowej. Dla każdej cechy cukru i kwasu uzyskano pojedynczy pomiar z dwóch połączonych owoców. Kawałki daty (bez kamienia) zamrożono ciekłym azotem i zmielono w proszku, umieszczono w dwóch oddzielnych szczelnych szklanych fiolkach, przechowywano w temperaturze -20 °C do czasu pobrania próbek. W przypadku suchej masy, w dwóch egzemplarzach, ważono 1 g próbki i umieszczano w piecu w próżni w temperaturze 70 °C na 72 godziny. kontrolę kontrolną sprawdzano przez 4 dni w celu określenia optymalnego czasu trwania. Ekstrakcję cukru przeprowadzono metodą zaadaptowaną z bchir i wsp.70. Dla każdej próbki 500 mg pasty daktylowej i 10 ml 80% etanolu umieszczono w probówce o pojemności 15 ml, ogrzewanej przez 5 minut w temperaturze 80 °C w łaźni wodnej. Każda rurka była następnie mieszana najpierw ręcznie, a następnie mechanicznie przez 15 minut dla lepszego rozprowadzania. Po odwirowaniu w temperaturze 9000 × g (Wirówka Avanti J-E; Beckman-Coulter, Brea, CA, USA), dno ekstrahowano dwukrotnie, a supernatanty zebrano, przesączono w temperaturze 0,45 µm i wstrzyknięto. Metodę testowano z kwaśną wodą (0,01 N H2SO4). Przykładowe standardy zostały Sigma-Aldrich (St.Louis, MO, USA) zostały wykorzystane.

Wilgotność owoców

próbki owoców przeprowadzono tak jak w sekcji zawartość cukru i kwasu w owocach powyżej. Miąższ daktylowy z dwóch owoców odzyskano i zmielono ciekłym azotem w celu homogenizacji próbki i przechowywano w temperaturze -80 °C w celu uzyskania pojedynczego pomiaru na odmianę. Zawartość wilgoci oznaczano grawimetrycznie, mierząc utratę masy 2,5 g próbek pulpy daktylowej, suszonych w temperaturze 70 °C, aż próbki osiągnęły stabilną masę.

analiza asocjacji dla całego genomu

przeprowadziliśmy analizę mapowania asocjacji dla całego genomu przy użyciu pakietu Gap R25. Aby zapewnić wydajność obliczeniową i zminimalizować problemy z wielokrotnymi testami, ale zapewnić gęste pokrycie w odniesieniu do odległości rozpadu LD, użyliśmy losowego zestawu SNP o wartości 5,5% (392 948 SNP). CMLM26 wykorzystując zarówno strukturę populacji, jak i informacje o pokrewieństwie jako współzmienne, przeprowadzono na genotypach z 157 próbek palmy daktylowej. Struktura populacji została wywnioskowana za pomocą analizy głównych składników (PCA) Wygenerowanej Przez Gapit przy użyciu 1% SNP (losowo pobranych próbek). Gapit dalej używał pierwszych pięciu składników PCA (rys. 1a; Dane uzupełniające 2). Pokrewieństwo zostało wywnioskowane za pomocą algorytmu Vanradena (dane uzupełniające 3). Znaczące SNP zidentyfikowano stosując konserwatywny próg Bonferroni p < 1,27 × 10-7. W przypadku cech ze znaczącymi wynikami przeprowadziliśmy drugą analizę GWAS z wykorzystaniem pełnego zestawu SNP dla poszczególnych LGs, w których zidentyfikowano znaczące SNP.

charakterystyka Ibn Majida i genu VIR

wcześniej zidentyfikowaliśmy polimorfizm insercji retrotranspozonu podobny do kopii w eksonie 3 czynnika transkrypcyjnego R2R3-MYB13 (ID genu NCBI: LOC103717680), który jest ortologiczny do genu Virescens (VIR) w Palmie olejowej28. Aby scharakteryzować ten retrotranspozon, amplifikowaliśmy przez PCR długie końcowe powtórzenia pierwiastka (jak również sąsiednią sekwencję genu VIR)w odmianach Thory i Empress zebranych odpowiednio z farmy USDA w Thermal w Kalifornii i USDA/UC Riverside farm, używając bufora GoTaq PCR core Systems (Promega, Madison, WI USA) i polimerazy.

pary starterów 5′-TGT GTC CGG CAT TGC ACT TCT-3′ (forward) I 5′-GCT CAA TGT TGA TGT TCT TGT TGG-3′ (reverse) zostały użyte dla 5′ LTR, a 5′-ACTC TGA CTA CCA AGT ACT TGA TG-3′ (forward) I 5′-CTG CAC TAT TAT CAC AGT AGA TGG-3′ (reverse) dla 3′ ltr. Wzmocnione produkty zostały wysłane do sekwencjonowania Sangera w GeneWiz (South Plainfield, New Jersey). Nasz zespół genomu zawiera również kompletną kopię wstawiania (~11,7 kb). BLAST był używany do wyrównania wstawiania względem siebie w celu zidentyfikowania pasujących długich regionów powtórzeń końcowych. Program LTRdigest71 został użyty do potwierdzenia wyników wybuchu. W wyniku eksplozji znaleziono pełną sekwencję Ibn Majida w stosunku do genomu palmy daktylowej w celu ustalenia numeru kopii.

tabela uzupełniająca 11 zawiera współrzędne naszej ręcznej adnotacji genu VIR w męskim zespole BC4. Genotypowanie insercji Ibn Majida w Vir exon 3 w odmianach palmy daktylowej przeprowadzono przez ręczną kontrolę wyrównanych odczytów obejmujących region insercji w JBrowse72. Ponieważ zespół męskiego genomu BC4 ma allel wstawiania (VIRIM, patrz Fig. 3), zmapowane odczyty pochodzące z typu wild (VIR+) lub allele niewprowadzające są miękko przycięte na granicy wstawiania eksonu 3. Oceniliśmy obecność soft-clipped reads (wspierający obecność allelu VIR+) lub unclipped reads obejmujących granicę wstawiania eksonu 3 (wspierającą obecność allelu wstawiania VIRIM) w celu identyfikacji genotypów. Powtórzyliśmy tę procedurę, badając dopasowania odczytu na obu końcach 5′ I 3 'insercji w męskim zespole BC4 i próbki, w których zarówno genotypy 5′ I 3′ dały dopasowane genotypy, zostały zachowane do analizy. Biorąc pod uwagę nasze zainteresowanie fenotypami kolorów owoców, genotypowaliśmy tylko palmy żeńskie.

charakterystyka inwertaz i polimorfizmów delecji

badanie genów w składzie cukru QTL na LG 14 (dane uzupełniające 6) początkowo ujawniło trzy pozycyjne kandydaty—alkaliczną / neutralną inwertazę (chr14G0028200) i dwie sąsiadujące inwertazy ściany komórkowej (chr14G0022900 i chr14G0023100) przewidywane przez nasz rurociąg adnotacji genów. Sprawdziliśmy, czy w tym regionie nie występują dodatkowe niezidentyfikowane kopie inwertazy, dostosowując przewidywane transkrypty dla każdego z trzech genów do tego regionu, używając transkryptu Splignu do narzędzia do wyrównywania genów73. To odzyskało sekwencję nici minus (którą nazywamy cwinv2), o zbliżonej homologii do flankujących inwertaz CWINV1 i CWINV3 przy 2,489,373 do 2,485,592, ale wielokrotne insercje/delecje w regionach homologicznych do eksonów CDs inwertazy.

głębokość pokrycia dla analizy zmian delecji określono w pojemnikach 500 bp nie nakładających się na siebie z samtools bedcov74 (V.1.9) używanie ustawień domyślnych. Wartości głębokości surowej znormalizowano niezależnie dla każdej próbki, dzieląc głębokość surową każdego pojemnika przez medianę głębokości surowej wszystkich pojemników na LG 14 po transformacji log2 po Flowers i in.75. Próbki genotypowano do homozygotycznej delecji i alternatywnych klas genotypów dla delecji 40 kb poprzez ręczną kontrolę dodatkowej Fig. 12. Homozygotyczne genotypy do delecji przed A / N-INV1 (rys. 4, Dodatkowe Rys. 13) zostały wywołane przez ustawienie progu wymagającego, aby co najmniej jeden interwał 500 bp w obszarze delecji 5 kb miał log2 znormalizowaną głębokość mniejszą niż -5. Obecnie nie jest możliwe odróżnienie heterozygotów dla alleli delecyjnych od homozygotów insercyjnych ze względu na umiarkowany zasięg w naszych danych dotyczących sekwencjonowania.

Test enzymu inwertazy

do testu inwertazy wybrano dwie odmiany sacharozy i dwie odmiany cukru redukującego. Eksperyment przeprowadzano przez dwa dni ze wszystkimi czterema odmianami reprezentowanymi przez jeden owoc każdego dnia. Testy przeprowadzono na jednym z owoców w fazie khalal-mrożonych w momencie zbierania (patrz wyżej), a następnie przechowywano w temperaturze -80 °C. z mrożonych owoców daktylowych uzyskano surowe ekstrakty zgodnie z protokołem Hasegawy i Smolensky33. Każdy zamrożony owoc sproszkowano moździerzem i tłuczkiem (z usuniętymi nasionami), a następnie zmielono w blenderze kuchennym i 5 g umieszczono w zimnym buforze do ekstrakcji (20 ml 4,0% NaCl, 1 g poliwinylopirolidonu, PVP). Dodatkowy etap maceracji przeprowadzono w homogenizatorze laboratoryjnym przez 1-2 min. Ekstrakt następnie odwirowano w temperaturze 20 000 × g przez 15 minut w temperaturze 4 °C. supernatant zawierający rozpuszczalną inwertazę przechowywano na lodzie, a pozostałą część odwirowano po raz drugi w temperaturze 20 000 × g przez 15 minut w temperaturze 4 °C. supernatanty połączono i 10 ml dializowano w stosunku do zimnej wody w temperaturze 4° C przez noc w celu usunięcia cukrów z ekstraktu. Następnie próbkę podzielono, a połowę próbki gotowano w temperaturze 100 °C, aby zmierzyć aktywność tła z potencjalnego skażenia cukru z owoców. Aktywność inwertazy unboiled i gotowanych surowych ekstraktów mierzono następnie metodą kolorymetryczną na czytniku mikropłytek Synergy H1 z zestawem do oznaczania enzymów sprzężonych (Sigma catalog no . MAK118) zgodnie z instrukcjami producenta.

Analiza RNA-Seq owoców

zebrano dwa zbiory danych RNA-Seq, aby odpowiedzieć na pytania dotyczące rozwoju owoców i zmian cech owoców. RNA-Seq na różnych etapach rozwoju owoców przeprowadzono na owocach zebranych w 2014 r.z drzew replikowanych znajdujących się na terenie Uniwersytetu Zjednoczonych Emiratów Arabskich, Date Palm Tissue Culture Laboratory w Al-Ain, ZEA. Do tego eksperymentu trzy lub cztery oddzielne drzewa odmian Khenezi (odmiana o czerwonych owocach) i Khalas (żółty owoc) były wielokrotnie próbkowane w 45, 75, 105, 120 i 135 dni po zapyleniu i owoce zamrożone na ciekłym azocie. RNA ekstrahowano z pojedynczego owocu z każdego z trzech lub więcej drzew na odmianę zgodnie ze standardowymi protokołami przygotowania Biblioteki TruSeq i 2 × 101 bp sekwencjonowanie końców sparowanych przeprowadzono na Illumina HiSeq 2500.

w 2016 roku przeprowadzono drugi eksperyment na owocach khalal stage zebranych na farmie Al-Shuwaib. Z każdej z ośmiu Palm zebrano trzy owoce, każda z innej odmiany, wybranej ze względu na to, że znajdują się one w ekstremalnych proporcjach sacharozy i cukru redukującego lub są w ich pobliżu (tj. wysokie i niskie stężenie sacharozy). Owoce przetwarzano w sposób opisany powyżej, a Biblioteki konstruowano za pomocą zestawu NextEra Library preparation kit (Illumina) i sekwencjonowania 2 × 76 bp w parze na instrumencie NextSeq (Illumina).

analizę ekspresji różnicowej przeprowadzono przycinając surowe odczyty sekwencjonowania za pomocą Trimmomatic45 (v 0.36) z parametrami ILLUMINACLIP:〈adapter fasta〉:2:30:10 TRAILING:3 LEADING:3 SLIDINGWINDOW:4:15 MINLEN:36. Odczyty zostały następnie wyrównane do męskiego genomu referencyjnego BC4 z rozdziałem gwiazdowym read aligner47 (V. 2.5.3a) i odczytywać liczby generowane na gen przez połączenie eksonów z htseq-count76 (V. 0. 9. 1) ustawione tak, aby zawierało tylko unikalnie zmapowane odczyty (np. htseq-count options — type = exon — mode = union–nonunique = none). Normalizację liczby odczytów przeprowadzono metodą mediany współczynników deseq277 (v. 1.8.2). Testy ekspresji różnicowej odmian Virescens (Pdac_HC_chr4G0137100) pomiędzy odmianami czerwonymi (Khenezi, N = 3 biblioteki replikowane) i żółtymi (Khalas, N = 3 lub 4 biblioteki replikowane) przeprowadzono oddzielnie dla każdego z punktów czasu rozwoju owoców 45, 75, 105, 120 i 135 dni po zapyleniu. Wartości P są zgłaszane dla testu Walda hipotezy braku różnicy między wyrażeniem Khenezi i Khalas na każdym etapie.

analiza RNA-seq różnicowej ekspresji genów inwertaz A/N-INV1, CWINV1 i CWINV3 (odpowiednio Pdac_HC_chr14G0028200, Pdac_HC_chr14G0022900 i Pdac_HC_chr14G0023100) pomiędzy sacharozą (n = 4 odmiany) i cukrem redukującym (N = 4 odmiany) została przeprowadzona przez zbudowanie trzech bibliotek dla każdej odmiany z wyekstrahowanego RNA niezależnie od trzech różnych owoców następuje sekwencjonowanie każdej biblioteki. Analizę ekspresji różniczkowej między odmianami sacharozy i typu redukującego przeprowadzono następnie przez wyrównanie odczytów z gwiazdką (patrz wyżej), zliczanie odczytów z liczbą htseq i generowanie macierzy liczby surowej w DESeq2. Surowe liczby na gen zostały następnie zsumowane w bibliotekach dla każdej odmiany ze względu na niską liczbę odczytów w niektórych bibliotekach. Późniejsza analiza została przeprowadzona przez pierwsze upuszczenie genów o niskiej liczbie (geny o odczycie <10 zsumowanych we wszystkich 8 próbkach), a następnie standardowy przepływ pracy DESeq2 (V. 1. 22. 2) z czterema replikatami biologicznymi (tj., odmiany palmy daktylowej) w każdej grupie leczonej. Nieskorygowane wartości P dla hipotezy braku ekspresji różnicowej przedstawiono w tekście głównym dla trzech genów kandydujących.

Podsumowanie Raportu

Więcej informacji na temat projektu badawczego można znaleźć w podsumowaniu raportu Przyrodniczego połączonym z tym artykułem.