Articles

Genomu-široký sdružení mapování datum palm ovoce rysy

Genomu sekvenování BC4 muž

Jsme použili zpětné křížení muž datum palm se nachází v Oddělení Spojených Států Zemědělství (USDA)/University of California, Riverside farm v Thermal, California (USDA přistoupení Ne. PI 555415, zdroj RIV 7545 PL). Tento muž byl produkován čtyři generace zpětným křížením s Barhee žena jako opakující se mateřská jako součást chovného programu v USDA, USA, která byla ukončena v 1970s10,18. Letáky byly vyčištěny a snap zmrazené v tekutém dusíku před přepravou do Arizony Genomics Institute (University of Arizona, Tucson, AZ) pro extrakci vysoké molekulové hmotnosti DNA a sekvenování.

genom samce BC4 byl sekvenován pomocí sekvenční platformy PacBio RSII. Vysokomolekulární DNA pro sekvenování byla extrahována z mladých listů přijetím protokolu Doyle a Doyle42 s menšími modifikacemi. Příprava knihovny PacBio se řídila protokolem 20 kb a byly postaveny tři knihovny (gel-vybrané na 20, 25 a 30 kb). Osmdesát pět SMRT buňky byly sekvenovány na RSII sekvencer s movie collection dobu 6 h. Asi 6,4 milionu čte byly vytvořeny v celkové výši 72 Gb dat (tím subread délka 11.2 kb, N50 18.5 kb). Další sekvenování knihovny krátkých vložek (2 × 100 bp paired-end) bylo provedeno se sekvencerem Illumina HiSeq 2500.

Genomu shromáždění

Jsme udělali k-mer-podle odhadu velikosti genomu z raw krátké čtení sekvence BC4 mužského genomu pro montážní účely (KmerFreq_AR v SOAPdenovo243) s výchozí nastavení a k-mer délka nastavena na 17. Všimněte si, že experimentální odhad velikosti genomu pro P. dactylifera byl také proveden pomocí průtokové cytometrie (viz níže). PacBio čte byly pak sestaveny s FALCON-Unzip19 (v. sokol-2017.06.28–18.01-py2.7-ucs2) s osivem, pokrytí 55 x a k-mer-na základě velikosti genomu odhad 774 Mb jako vstup. Modul rozbalení byl spuštěn s výchozím nastavením.

výsledná sestava byla leštěné sladěním syrové PacBio čte s Toulec a Šíp (část SMRT Analýzy apartmá v. 2.3.0), následuje běh Pilon44 v. 1.18 s Illumina číst krátké sekvence z BC4 muž. Vstupy do Pilon byly vyrobeny stříhání krátké čte s Trimmomatic45 (v. 0.32) odstranit 3 základy pod základní kvalitu Q30 a čte kratší než 30 nukleotidů. Čtení bylo poté zarovnáno s výstupem šipky s Bowtie246 (v. 2.2.6).

leštěné primární kontigy byly ukotveny k LGs existující genetické map21 s ALLMAPS22, aby se vytvořila ukotvená haploidní sestava. Sekvence lešení pro genetickou mapu byly získány z http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gz. Po zarovnání s genetickou mapou a po ruční kontrole přeskupení surových čtení do sestavy, našli jsme pouze jednu instanci nesprávné sestavy: jeden contig musel být rozdělen, protože dva konce contig byly sloučeny hlava-Hlava.

anotace Genomu

Jsme vytvořili RNA-Seq knihovny z více khalal fázi ovoce (viz níže), směs mužských a ženských poupata (dále jen „květina“ níže), a pyl, a provedli 2 × 100 bp párových-end sekvenování na Illumina HiSeq 2500 nástroje (Doplňující Tabulka 7). Další data data Palm RNA-Seq z listu a kořene byla stažena z archivu čtení sekvence (doplňková Tabulka 7). RNA-Seq čte byly zdobené s Trimmomatic45, zarovnán na haploidní sestavy s STAR47 (v. 2.4.0.1), a genu modely předpovídal StringTie48 (v. 1.3.2), které mají být použity jako školení pro Augustus49 (v. 2.3).

genová anotace byla provedena pomocí MAKER2 pipeline50 (v. 2.31). Homologie-založené na důkazech, včetně 7097 Est (stažena z NCBI EST databáze na 9. února 2017), proteinových sekvencí z Uniprot51, datlovník proteomu , palmový olej proteome52, a RNA-Seq modely odvozené od výše uvedených. Ab initio predikce byla provedena s Augustus (v. 3.0) vyškoleni, jak je popsáno v Bowman et al.53 s genovými modely vyrobenými pomocí StringTie48 (v. 1.3.2), z zarovnání RNA-Seq.

raw MAKER2 anotace byl analyzován, odstranění modely obsahující TE domén a chybí důkazy o přepis nebo přítomnost Pfam domény, jak je popsáno v Bowman et al.53. S asi 1× non-organellar single-end WGS Illumina čte, de novo (non sestavy-based) opakujte knihovna byla vyrobena s RepeatExplorer54, a analyzovat, jak v Copetti et al.55. Opakujte anotace montáž byla provedena s RepeatMasker (v. 4.0.6; v nukleotidové prostor) a Blaster56 (část REPET v 2.5 balíček, ve bílkovin prostoru) a později usmířili v jediném anotace soubor. Nekódující RNA byly předpovězeny pomocí Infernal57 (v. 1.1.2) s Knihovnou Rfam58 (v. 12.2). Hity nad prahovou hodnotou e 1 × 10-5 byly odfiltrovány, stejně jako výsledky se skóre nižším, než je práh shromažďování specifický pro rodinu. Když se předpovídaly loci na obou pramenech, zůstal zachován pouze zásah s nejvyšším skóre. Přenosové RNA byly také předpovězeny pomocí tRNAscan-SE59 (v. 2.0) s výchozími parametry.

hodnocení kvality genomu

vizualizace sestavy genomu byly vytvořeny pomocí softwaru assembly-stats (Doplňkový obr. 1, ). Montáž úplnost byla hodnocena charakterizující genu prostor s BUSCO20 pomocí 1440 rostlin ortholog skupin (v. 3) a sladěním Jsi na diploidní sestavě s Blat60 (v. 350).

odhad velikosti datlovníku genomu

velikost genomu byla odhadnuta pomocí jednostupňové průtokové cytometrie popsané v Doležel et al.61 s drobnými úpravami. Krátce, přibližně 1 cm2 listového materiálu ze dvou P. vzorky dactylifera v Royal Botanic Gardens, Kew, UK collection byly inkubovány po dobu 30 s na ledu v 1 ml „general purpose pufr“ (GPB)62 doplněné 3% PVP-40 pro změkčení listu. Pak podobné množství listového materiálu kalibračního standardu Petroselinum crispum (Mlýn.)Byl přidán rozruch (hodnota 1C = 2201 Mb) 63 a kombinovaný materiál byl rychle nasekán (ale ne příliš energicky)pomocí nové žiletky. Další 1 ml GPB pufru bylo přidáno a pak homogenát byl filtrován přes 30 µm nylon mesh (Celltrics 30 µM ok, Sysmex, Goritz, Německo) do zkumavky, 100 µl propidium jodidu (1 mg/mL) byl přidán, a vzorek byl inkubován na ledu po dobu 10 min. Relativní fluorescence 5000 částic byla zaznamenána pomocí Partec Cyflow SL3 průtokovým cytometrem (Partec GmbH, Münster, Německo) vybavené 100 mW zelená solid-state laser (532 nm, Cobolt Samba, Solna, Švédsko). Byly zpracovány tři repliky každého listu a výstupní histogramy byly analyzovány pomocí softwaru FlowMax v. 2.4 (Partec GmbH). 1C hodnotu P. dactylifera (Mbp) byla vypočtena jako: (průměrná hodnota polohy P. dactylifera/průměrná hodnota polohy P. crispum) × 2201 Mb (=1C hodnotu P. crispum)63.

panel GWAS

Fenotypizace GWAS byla provedena na datlových palmách umístěných na dvou farmách ve Spojených arabských emirátech. Farmy se nacházejí ve Výzkumném středisku Date Palm v Hamriyah, Ras Al-Khaimah (n = 46) a v Al-Shuwaib, Al-Ain, Abu Dhabi (n = 111). Populace se skládá především z ženských komerčních odrůd (n = 145). Samci (n = 12) rostoucí na farmách byli také sekvenováni primárně za účelem mapování lokusu určujícího pohlaví.

Khalal fázi ovoce byly odebrány vzorky od jara do podzimu v roce 2016, a to buď snap zmrazené v tekutém dusíku pro RNA-sekvenování nebo získané jako čerstvé ovoce pro fotografie, skenování (viz níže) a charakterizace jiné ovoce rysy. Tamarské ovoce ze stejných stromů bylo shromážděno v létě 2017 pro profilování cukru a organických kyselin. Vzorky listů byly odebrány pro extrakci DNA a sekvenování genomu.

Genomová DNA byla extrahována z buď list nebo ovoce mesocarp/obalová tkání pomocí DNeasy plant mini kit (Qiagen, Venlo, Nizozemí). Sloupce pro extrakci DNA a knihovny připravené pomocí sady Illumina Nextera (San Diego, CA). Na sekvenceru Illumina HiSeq 2500 S až osmi knihovnami na jeden pruh bylo provedeno párové sekvenování 2 × 100 bp. Čte byly demultiplexed a ti kolem Illumina kontroly kvality filtry byly zpracovány s Trimmomatic45 (v. 0.36) pro odstranění kontaminujících adaptér sekvence. Pro adaptér odstranění jsme použili adaptér a Nextera transposase sekvence databáze součástí Trimmomatic (verze 0.32) ke stažení následující nastavení ILLUMINACLIP:〈adaptér knihovna〉:2:30:10 MINLEN:76 zachovat pouze číst párů, kde oba čte byly 76 bps nebo déle po ořezávání.

Čte byly zarovnány odhalen BC4 mužské sestavy (primární contigs pouze) pomocí bwa mem (v. 0.7.15-r1140 ). BWA mem aligner byl spuštěn s volbou-M pro označení doplňkových Čtení (0 × 800 bitový příznak) jako sekundární (0 × 100). Vzorek zarovnání byly zpracovány s FixMateInformation (Picard-tools v. 2.8.2; http://broadinstitute.github.io/picard) k zajištění konzistence v párových-přečtěte si informace, SamSort (Picard-tools v. 2.8.2) koordinovat-druh postavení, MarkDuplicates (Picard-tools v. 2.8.2) označit duplicitní páry, a s GATK64 IndelRealignerTargetCreator/IndelRealigner nástroj (GATK. v. 3.7-0) seřídit čte v indel regionů. Zarovnání vzorků bylo ověřeno v každém kroku pomocí ValidateSam (Picard-tools v. 2.8.2), aby nedošlo k chybám ve výrobě. Zpracované zarovnání byly shrnuty pomocí CollectAlignmentSummaryMetrics (Picard-tools v. 2.8.2) a Samtools .

SNP volání a genotypizace

SNP-volání a genotypizace byla provedena s GATK (v. 3.7-0) HaplotypeCaller spustit v GVCF režimu následuje společné-genotypizace s GenotypeGVCFs . Čte byly filtrovány z HaplotypeCaller krok vyloučit ty, kteří se mapování kvality méně než 20, a vyloučit ty, které jsou označené jako polymerázová řetězová reakce (PCR) duplikáty nebo sekundární zarovnání (viz výše). Tento přístup přinesl 32 384 028 SNP ve všech vzorcích. Filtrování SNP bylo provedeno použitím tvrdých filtrů na varianty raw pomocí GATK v. 4.0.2.1. Jsme filtrované surové hovor nastaven na vyloučit Snp s nízkým (<785) a vysoká hloubka (>2862) sčítat napříč vzorky. Jsme také vyloučeny multi-allelickou Snp, Snp do 10 bp indel polymorfismy, Snp, které splňují tyto podmínky: QUAL < 30 a QD < 5.0. Genotypy byly nastaveny jako chybějící, pokud byl DP nižší než 5 nebo vyšší než 20, stejně jako SNP s frekvencí volání genotypu < 80% nebo menší frekvencí alely pod 0,01. Odhadovali jsme P hodnoty pro každý web z Hardy–Weinberg Equilibrium test pomocí VCFtools65 a odfiltrovány Modifikace vykazuje přebytek ve heterozygotnost (přesný test, P < 0.05). Tento postup přinesl filtrovanou sadu volání 7 149 205 SNP.

Statistická analýza

všechny statistické analýzy byly prováděny v jazyce R statistical computing, pokud není uvedeno jinak.

LD analýzy

LD byla odhadnuta metodou pro odhad r2, která je vhodná pro nerozhází dat (viz VCFtools65). Křivka rozpadu LD pro panel GWAS byla vypočtena jako v Flowers et al.4. Stručně řečeno, r2 byl vypočítán pro nefázované SNP s menší frekvencí alely vyšší než 10% pomocí volby-geno-ld ve VCFtools (v. 0.1.14). Rozpad křivky byly generovány montáž křivky k párového r2 odhadů fyzická vzdálenost mezi SNP dvojici s nelineární nejmenších čtverců pomocí přístupu upraveného z Marroni et al.66. Poloviční vzdálenost rozpadu byla poté vypočtena jako vzdálenost, při které r2 je polovina jeho maximální hodnoty (tj.

Charakteristika ovoce barva

Osm khalal fázi ovoce bez újmy na datum palm odrůdy byly sklizeny, opláchnuty pod tekoucí vodou a odstranit tak prach a pak se suší na vzduchu. Plody byly podélně krájeny a barva ovoce byla poté měřena pomocí dvou strategií. Nejprve jsme vyfotografovali nakrájené ovoce pomocí kontroly barev ve fotoateliéru fotoaparátu, kde byly snímky pořízeny na bílém pozadí s digitálním fotoaparátem. Barva ovoce byla analyzována pomocí softwaru Imagej67 pomocí barevných parametrů RGB.

za Druhé, jsme použili komplementární přístup, který jsme použili jako Rajče Analyzátor software68 v. 2.2 získat odhady barva parametry L*, a*, b*. Souřadnice L * vyjadřuje temnotu a světlost barvy a pohybuje se od černé (0) po bílou (100). Souřadnice a* A b * vyjadřují směr barev, kde +a* je v červeném směru − – a* v zeleném směru, + b* ve žlutém směru a-b * v modrém směru68. Získávání a analýza obrazu byla provedena tak, jak je popsáno v Rodríguez et al.27. Nakrájené ovoce bylo umístěno na skeneru s černým pozadím a zakryto, aby se zabránilo účinkům okolního světla. Naskenované obrázky byly uloženy jako soubory JPEG a odhady barevných parametrů L*, A*, b * byly provedeny na každém ovoci. Byl vypočítán průměr všech plodů. Obě metody byly vysoce korelované, takže jsme použili barevný index a*/b*, abychom vyhodnotili rozdíly v barvách kůže plodů a použili je pro asociační studii.

Ovoce anthokyaninového obsahu

Celkem anthocyanin byl extrahován ze tří opakování khalal fázi ovoce od každé datum palm řadu pomocí ovoce snap-zmrazené v tekutém dusíku podle postupu popsaného v Rabino a Mancinelli69 s menší modifikací. Krátce, anthocyanin z mraženého ovoce kůže (100 mg) se rozemele na jemný prášek a extrahován v 1 ml kyselé methanol (1% HCl) po inkubaci při pokojové teplotě ve tmě po dobu 18 h, následuje centrifugace po dobu 10 min při 12000 g. Kvantifikace celkových anthocyanin bylo provedeno pomocí absorbance měřena pomocí spektrofotometru pomocí rovnice.

Celkem anthocyanin = (A530-0.25 × A657)/FW, kde A530 a A657 nm je absorbance a FW je čerstvé hmotnosti rostlinného materiálu (g).

velikost ovoce

fotografie ovoce použité pro analýzu barev (viz výše) obsahovaly pravítko jako standard velikosti. ImageJ67 (v. 2) a Tomato analyzer software27 byly poté použity k odhadu délky a šířky ovoce.

Ovocný cukr a kyselinu obsah

Ovoce sacharózy, glukózy a fruktózy byly vyčísleny od 125 odrůd na tamar fázi, kdy plody jsou suché, zrání je kompletní a fázi, ve které data jsou obvykle spotřebovány. Plody byly snap-zmrazeny na -20 °C a mezi 10 a 15 plodů na řadu okamžitě byly udržovány při teplotě -20 °C až příjezdu na Montpellier (francouzské Zemědělské Výzkumné Středisko pro Mezinárodní Rozvoj, CIRAD), kde vysokoúčinná kapalinová chromatografie analýza byla provedena. Pro každý z cukerných a kyselých rysů bylo získáno jediné měření ze dvou sdružených plodů. Datum kousky (bez kamene) byly zmraženy kapalným dusíkem a země v prášku, dát do dvou samostatných úzkých skleněných lahviček, uloženy při teplotě -20 °C až do odběru. Pro sušině, ve dvou vyhotoveních, 1 g vzorku byl zvážen a umístěn do kamen ve vakuu při 70 °C po dobu 72 h. Kontrolou byla ověřena na 4 dny pro stanovení optimální doby trvání. Extrakce cukru byly provedeny metodou upravenou od Bchir et al.70. Pro každý vzorek, 500 mg datum vložení a 10 ml 80% ethanolu byla umístěna do 15 ml zkumavky, zahřívá se 5 min při 80 °C ve vodní lázni. Každá zkumavka byla poté nejprve ručně a poté mechanicky míchána po dobu 15 minut pro lepší šíření. Po centrifugaci při 9000 x g (Avanti J-E odstředivky; Beckman-Coulter, Brea, CA, USA), dna byla extrahována dvakrát a supernatanty se shromáždili, filtrovaný na 0,45 µm a injekčně. Metoda byla testována s kyselou vodou (0,01 N H2SO4). Vzorové standardy byly Sigma-Aldrich (St.Louis, MO, USA) byly použity.

obsah vlhkosti ovoce

odběr vzorků ovoce byl proveden jako v části o obsahu ovocného cukru a kyseliny výše. Datum buničiny ze dvou plodů bylo nalezeno a země s kapalným dusíkem homogenizujte vzorek a skladovány při -80 °C získat jedno měření za různých. Obsah vlhkosti byl gravimetricky stanoven měřením úbytku hmotnosti 2,5 g vzorků Datlové buničiny, sušených při 70 °C, dokud vzorky nedosáhly stabilní hmotnosti.

celogenomová asociační analýza

spustili Jsme genomu-široký sdružení mapování analýza pomocí Gapit R package25. Pro výpočetní efektivitu a minimalizovat více-testování otázek, ale poskytují husté pokrytí s ohledem na LD kaz vzdálenost, jsme použili 5,5% převzorkuje dolů náhodné SNP set (392,948 Snp). CMLM26 používající jak strukturu populace, tak informace o příbuznosti jako kovariáty byly provedeny na genotypech ze vzorků 157 datlovníků. Populační struktura byla odvozena pomocí analýzy hlavních komponent (PCA) generované Gapit za použití 1% SNP (náhodně odebraných vzorků). Gapit dále použil prvních pět složek PCA (obr. 1a; doplňkové údaje 2). Příbuznost byla odvozena pomocí Vanradenova algoritmu (doplňující údaje 3). Významné SNP byly identifikovány pomocí konzervativního Bonferroniho prahu p < 1,27 × 10-7. Pro vlastnosti s významnými výsledky, dále jsme provedli druhou analýzu GWAS pomocí úplné sady SNP na konkrétních LGs, kde byly identifikovány významné SNP.

Charakteristika Ibn Majid a VIR gen

již dříve Jsme identifikovali copia-like retrotransposon vložení polymorfismus v exonu 3 z R2R3-MYB transkripční factor13 (NCBI Gene ID: LOC103717680), který je ortologní k genu Virescens (VIR) v olejové palmě28. Charakterizovat toto retrotransposon, jsme PCR-zesílený prvek dlouho terminálu, opakuje se (stejně jako přilehlé sekvence genu VIR) v Žpráva a Císařovna druhů odebraných z USDA farmě v Thermal, California a USDA/UC Riverside farm respektive pomocí GoTaq PCR Core Systems (Promega, Madison, WI, USA) pufr a polymeráza.

páry primerů 5′-TGT VOP CGG CAT TGC ZÁKONA TCT-3′ (dopředu) a 5′-CAA GCT TGA TGT TGT TCT TGT TGG-3′ (reverse) byly použity k 5′ LTR a 5′-ACTC TGA CTA CCA AGT ACT TGA TG-3′ (dopředu) a 5′-CTG CAC TAT TAT CAC AGT AGA TGG-3′ (reverzní) pro 3′ LTR. Amplifikované produkty byly odeslány k sekvenování Sanger v GeneWiz (South Plainfield, New Jersey). Naše sestava genomu také obsahuje kompletní kopii vložení (~11.7 kb). BLAST byl použit k zarovnání vložení proti sobě, aby se identifikovaly odpovídající oblasti opakování dlouhých terminálů. Program LTRdigest71 byl použit k potvrzení výsledků výbuchu. VÝBUCH vyhledávání dotazovány plné Ibn Majid sekvence proti datlovník genomu k určení počtu kopií.

doplňková tabulka 11 poskytuje souřadnice naší ruční anotace genu VIR v mužské sestavě BC4. Genotypizace vložení Ibn Majid ve VIR exon 3 u odrůd datlové palmy byla provedena ruční kontrolou zarovnaných čtení přesahujících oblast vložení v JBrowse72. Protože sestava mužského genomu BC4 má zaváděcí alelu (VIRIM, viz obr. 3), mapované čtení pocházející z divokého typu (VIR+), nebo alely bez vložení, jsou soft-oříznuty na hranici vložení exon 3. Jsme zaznamenal přítomnost soft-připnutý čte (podporující přítomnost VIR+ alela) nebo uvolněny čte zahrnující exon 3-vložení hranice (podporující přítomnost VIRIM vložení alely) pro identifikaci genotypů. Tento postup jsme opakovali zkoumáním zarovnání čtení na obou koncích 5 „a 3“ vložení do mužské sestavy BC4 a vzorků, kde oba genotypy 5 „a 3“ přinesly odpovídající genotypy, byly zachovány pro analýzu. Vzhledem k našemu zájmu o fenotypy ovocných barev jsme genotypizovali pouze ženské dlaně.

Charakteristika invertases a mazání polymorfismy

Vyšetření genů v cukru složení QTL na LG 14 (Doplňující Údaje 6) zpočátku odhalil tři poziční kandidátů—zásadité/neutrální invertáza (chr14G0028200) a dva přilehlé buněčné stěny invertases (chr14G0022900 a chr14G0023100) předpovídal náš gen anotace potrubí. Zkontrolovali jsme pro potenciální další unannotated kopie invertáza v této oblasti sjednotí předpověděl přepisy pro každý ze tří genů do této oblasti pomocí Splign přepis genomu zarovnání tool73. To se zotavil a mínus vlákno sekvence (které označujeme jako CWINV2), s téměř shodnou s doprovodnými invertases CWINV1 a CWINV3 na 2,489,373 na 2,485,592, ale více inzerce/delece v regionech homologní s invertáza CD exons.

hloubka pokrytí pro deleční variační analýzu byla stanovena v 500 bp nepřekrývajících se zásobnících se samtools bedcov74 (v. 1.9) použití výchozího nastavení. Hodnoty surové hloubky byly normalizovány nezávisle pro každý vzorek vydělením surové hloubky každého koše střední hloubkou suroviny všech zásobníků na LG 14 po transformaci log2 po Flowers et al.75. Vzorky byly genotypizovány do homozygotní delece a alternativních genotypových tříd pro 40 kb delece ruční kontrolou doplňkového Obr. 12. Homozygotní genotypy pro deleci před A / N-INV1 (obr. 4, Doplňkový Obr. 13) byly vyvolány nastavením prahové hodnoty vyžadující, aby alespoň jeden interval 500 bp v oblasti delece 5 kb měl normalizovanou hloubku log2 menší než -5. V současné době, to není možné rozlišit heterozygoti pro odstranění alely od vložení homozygotů vzhledem k mírné pokrytí v naší re-sekvenování data.

test enzymu invertázy

pro test invertázy byly vybrány dvě odrůdy sacharózy a dvě odrůdy redukujícího cukru. Experiment byl proveden ve dvou dnech se všemi čtyřmi odrůdami představovanými jediným ovocem každý den. Testy byly prováděny na jednom khalal fázi ovoce snap-zmrazené v době odběru (viz výše), následuje skladování při -80 °C. Surové extrakty byly získány ze zmrazených datum ovoce v návaznosti na protokol o Hasegawa a Smolensky33. Každý mražené ovoce byl práškové s maltou a paličkou (semena odstraněn), a pak se mele v mixéru, a 5 g se umístí do studené extrakčního pufru (20 ml 4,0% NaCl, 1 g polyvinylpyrrolidonu, PVP). Další macerační krok byl proveden v laboratorním homogenizátoru po dobu 1-2 minut. Extrakt byl poté centrifugovány rychlostí 20 000 × g po dobu 15 min při 4 °C. supernatant obsahující rozpustný invertáza byl uložen na led a zbytek odstředí podruhé na 20 000 × g po dobu 15 min při 4 °C. supernatanty byly spojeny a 10 ml dialyzed proti studené vodě při 4° c přes noc odstranit cukry z extraktu. Vzorek byl poté rozdělen, a jeden-polovina vzorku se vaří při 100 °C k měření aktivity pozadí z potenciálních kontaminujících cukr z ovoce. Invertáza činnost nevařený a vařené surové extrakty pak byla měřena pomocí kolorimetrické zkoušky na Synergy H1 reader na mikrotitrační destičce s spolu enzyme assay kit (Sigma katalog ne. MAK118) podle pokynů výrobce.

analýza ovoce RNA-Seq

byly shromážděny dva datové soubory RNA-Seq, které se zabývaly otázkami týkajícími se vývoje ovoce a variací vlastností ovoce. RNA-Seq na různé ovoce fázích rozvoje bylo provedeno na ovoce shromážděné v roce 2014 od replikovat stromy se nachází v areálu United Arab Emirates University, Datum Palm Tkáňové Kultury Laboratoř v Al-Ain, spojené arabské EMIRÁTY. Pro tento experiment, tři nebo čtyři samostatné stromy Khenezi (odrůda s červenými plody) a Khalas (žluté ovoce) odrůdy byly odebrány vzorky opakovaně na 45, 75, 105, 120 a 135 dnů po opylení a ovoce snap-zmrazené v tekutém dusíku. RNA byla extrahována z jednoho ovoce ze tří nebo více stromů na řadu následující standardní protokoly pro TruSeq knihovna přípravy, a 2 × 101 bp párových-end sekvenování provádí na Illumina HiSeq 2500.

v roce 2016 byl proveden druhý experiment na ovoci khalal stage shromážděném na farmě Al-Shuwaib. Tři plody byly odebrány z každého z osmi dlaně, každý z jiné odrůdy vybrány na základě jejich bytí na nebo v blízkosti extrémů, sacharosy a redukujících cukrů typ rozdělení (tj. vysoké a nízké koncentrace sacharózy). Plody byly zpracovány, jak je popsáno výše a knihovny konstruovány s Nextera library preparation kit (Illumina) a 2 × 76 bp párových-end sekvenování provádí na NextSeq (Illumina) nástroje.

Diferenciální exprese analýza byla provedena pomocí ořezávání raw sekvenční čte s Trimmomatic45 (v, 0.36) s parametry ILLUMINACLIP:〈adaptér fasta〉:2:30:10 KONCOVÉ:3 VEDOUCÍ:3 SLIDINGWINDOW:4:15 MINLEN:36. Reads byly poté zarovnány s BC4 mužským referenčním genomem s hvězdným rozdělením read aligner47 (v. 2.5.3a) a přečtěte si počítá generované na genu tím, že unie exons s htseq-count76 (v. 0.9.1) nastavit, aby zahrnoval pouze jednoznačně mapované čte (tj. htseq-počet voleb –type = exon–mode = unie-nejedinečná = none). Normalizace počtu čtení byla provedena metodou mediánu poměrů DESeq277 (v. 1.8.2). Zkoušky z diferenciální výraz Virescens (Pdac_HC_chr4G0137100) mezi červenou (Khenezi, n = 3 opakované knihoven) a žlutá (Khalas, n = 3 nebo 4 opakování knihoven) odrůd byly prováděny odděleně pro každou z ovoce rozvoj čas, body 45, 75, 105, 120 a 135 dnů po opylení. Hodnoty P jsou uvedeny pro Waldův test hypotézy o žádném rozdílu mezi expresí Khenezi a Khalas v každé fázi.

RNA-seq analýza diferenciální genové exprese invertases A/N-INV1, CWINV1, a CWINV3 (Pdac_HC_chr14G0028200, Pdac_HC_chr14G0022900, a Pdac_HC_chr14G0023100, v tomto pořadí) mezi sacharosy (n = 4 odrůdy) a snížení cukru typů (n = 4 druhů) byla provedena tři budovy knihovny na řadu z RNA získané nezávisle ze tří různých druhů ovoce následuje sekvenování každé knihovny. Analýza diferenciální exprese mezi sacharóza-typ a snížení typu odrůd pak byla provedena tak, že zarovnáte čte s HVĚZDOU (viz výše), počítání čte s htseq-počítat, a vytváří syrové počet matic v DESeq2. Surové počty na gen byly poté sčítány napříč knihovnami pro každou odrůdu kvůli nízkému počtu čtení v některých knihovnách. Následná analýza byla provedena první vrácení nízký počet genů (geny s <10 čte, sčítá přes všech 8 vzorků), následuje standardní DESeq2 (v. 1.22.2) pracovní tok s čtyř biologických opakování (tj., odrůdy datlové palmy) v každé skupině ošetření. Nekorigované hodnoty P pro hypotézu žádné diferenciální exprese jsou uvedeny v hlavním textu pro tři kandidátské geny.

souhrn hlášení

Další informace o návrhu výzkumu jsou k dispozici v souhrnu zpráv o výzkumu přírody, který je spojen s tímto článkem.