Articles

genom-dækkende associering kortlægning af dato palmefrugtegenskaber

Genomsekventering af BC4-hanen

vi samplede en backcross mandlig daddelpalme placeret ved det amerikanske landbrugsministerium (USDA)/University of California, Riverside farm i Thermal, Californien (USDA-tiltrædelse nr. PI 555415, kilde RIV 7545 PL). Denne mand blev produceret af fire generationer af backcrossing med en Barhee-kvinde som den tilbagevendende forælder som en del af et avlsprogram på USDA, USA,der blev afbrudt i 1970 ‘ erne10, 18. Brochurer blev rengjort og snapfrosset på flydende nitrogen inden transport til Genomics Institute (University of Tucson, Tucson) til ekstraktion af DNA med høj molekylvægt og sekventering.

genomet til BC4-hanen blev sekventeret ved hjælp af en PacBio RSII-sekventeringsplatform. DNA med høj molekylvægt til sekventering blev ekstraheret fra unge blade, der vedtog protokollen fra Doyle og Doyle42 med mindre ændringer. PacBio bibliotek forberedelse fulgte 20 kb protokol og tre biblioteker (gel-valgt på 20, 25, og 30 kb) blev bygget. Femogfirs SMRT-celler blev sekventeret på en RSII-sekvensator med filmopsamlingstid på 6 timer. cirka 6,4 millioner læsninger blev genereret, i alt 72 Gb data (gennemsnitlig underlæsningslængde 11,2 kb, N50 18,5 kb). Yderligere sekventering af et kort indsatsbibliotek (2 til 100 BP parret ende) blev udført med en Illumina Hisek 2500 sekvensator.

Genomsamling

vi foretog en k-mer-baseret estimering af genomstørrelsen fra rå korte læste sekvenser af BC4-mandgenomet til samlingsformål (Kmerfrekv_ar i SOAPdenovo243) med standardindstillinger og K-mer-længde indstillet til 17. Bemærk, at et eksperimentelt genomstørrelsesestimat for P. dactylifera også blev udført ved hjælp af strømningscytometri (se nedenfor). PacBio læser blev derefter samlet med FALCON-Udpakning19 (V. falcon-2017.06.28–18.01-py2.7-ucs2) med en frødækning på 55 liter og det k-mer-baserede genomstørrelsesestimat på 774 Mb som input. Udpakningsmodulet blev kørt med standardindstillinger.

den resulterende samling blev poleret ved at justere rå PacBio-læsninger med kogger og pil (en del af SMRT-Analysesuiten v. 2.3.0) efterfulgt af at køre Pilon44 v. 1.18 med Illumina korte læsesekvenser fra BC4-hanen. Input til Pilon blev produceret ved at trimme de korte aflæsninger med Trimmomatic45 (v. 0.32) for at fjerne 3′ baser under basiskvaliteten i 30.kvartal og læser kortere end 30 nukleotider. Aflæsninger blev derefter justeret til pilens udgang med Bue246 (v. 2.2.6).

de polerede primære contigs blev forankret til LGs af den eksisterende genetiske map21 med ALLMAPS22 for at producere en forankret haploid samling. Stilladssekvenser til det genetiske kort blev opnået fra http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gz. Efter tilpasning til det genetiske kort og efter manuel inspektion af omlægningen af de rå læser til samlingen, vi fandt kun en forekomst af forkert samling: en contig måtte opdeles, da to contig-ender blev fusioneret head-to-head.

genomanmærkning

vi genererede RNA-sek-biblioteker fra flere frugter fra khalalstadiet (se nedenfor), en blanding af mandlige og kvindelige blomsterknopper (benævnt “blomst” nedenfor) og pollen og udførte 2 l.100 BP parret-end sekventering på et Illumina Hisek 2500 instrument (supplerende Tabel 7). Yderligere data fra blad og rod blev hentet fra Sekvenslæsearkivet (supplerende Tabel 7). RNA-sek læser blev trimmet med Trimmomatic45, justeret til haploid samling med STAR47 (v. 2.4.0.1) og genmodeller forudsagt af StringTie48 (v. 1.3.2) skal bruges som træning for Augustus49 (v. 2.3).

Genanmærkning blev udført under anvendelse af MAKER2-rørledningen50 (v. 2.31). Homologibaseret evidens, inkluderet 7097 Est ‘ er (hentet fra NCBI EST-databasen den 9.februar 2017), proteinsekvenser fra Uniprot51, et datapalmeproteom, et oliepalmeproteom52 og RNA-Sekv-afledte modeller ovenfra. Ab initio forudsigelse blev udført med Augustus (v. 3.0) uddannet som beskrevet i bueskytte et al.53 med genmodeller produceret med StringTie48 (v. 1.3.2), fra RNA-Sekv-justeringerne.

den rå MAKER2-annotation blev analyseret, fjernelse af modeller indeholdende TE-domæner og manglende bevis for transkription eller tilstedeværelsen af et PFAM-domæne som beskrevet i Bovman et al.53. Med omkring 1 liter ikke-organellær single-end Illumina læser, a de novo (ikke-samlingsbaseret) gentagelsesbibliotek blev produceret med Gentagelsesudforsker 54og analyseret som i Copetti et al.55. Gentag annotation af samlingen blev udført med RepeatMasker (v. 4.0.6; i nukleotidrum) og Blaster56 (en del af REPET v 2.5-pakken, i proteinrum) og senere afstemt i en enkelt annotationsfil. Ikke-kodende RNA ‘ er blev forudsagt med Infernal57 (v. 1.1.2) med rfam library58 (v. 12.2). Hits over e-værditærsklen på 1 til 10-5 blev filtreret ud, samt resultater med score lavere end den familiespecifikke indsamlingstærskel. Da loci på begge tråde blev forudsagt, blev kun hit med den højeste score holdt. Transfer-RNA ‘ er blev også forudsagt ved hjælp af tRNAscan-SE59 (v. 2.0) med standardparametre.

genomkvalitetsvurdering

visualiseringer af genomsamlingen blev produceret med assembly-stats program (supplerende Fig. 1, ). Samlingens fuldstændighed blev evalueret ved at karakterisere genrummet med BUSCO20 ved anvendelse af 1440 planteorthologgrupper (v. 3) og ved at tilpasse Est ‘ er til den diploide samling med Blat60 (v. 350).

estimering af datapalm-genomstørrelse

genomstørrelsen blev estimeret ved hjælp af en-trins strømningscytometri-procedure beskrevet i Dole Larsel et al.61 med små ændringer. 1 cm2 bladmateriale fra to P. dactylifera-prøver ved Royal Botanic Gardens, kV, UK-samlingen blev inkuberet i 30 s på is i 1 ml “general purpose buffer” (GPB)62 suppleret med 3% PVP-40 for at blødgøre bladet. Derefter en tilsvarende mængde bladmateriale af kalibreringsstandarden Petroselinum crispum (Mølle.) Fuss (1C-værdi = 2201 Mb)63 blev tilsat, og det kombinerede materiale blev hugget hurtigt (men ikke for kraftigt) ved hjælp af et nyt barberblad. Yderligere 1 ml af GPB-bufferen blev tilsat, og derefter blev homogenatet filtreret gennem et 30 liter nylonnet (Celltrics 30 liter mesh, Sysmeks, Gorits, Tyskland) i et rør, 100 liter propidiumiodid (1 mg/mL) blev tilsat, og prøven blev inkuberet på is i 10 minutter. Den relative fluorescens af 5000 partikler blev registreret under anvendelse af et PARTEC Cysturn SL3-strømningscytometer (Partec GmbH, m Kurstnster, Tyskland) udstyret med en 100 mvgrøn solid state laser (532 nm, Cobolt Samba, Solna, Sverige). Tre replikater af hvert blad blev behandlet, og outputhistogrammerne blev analyseret ved hjælp af programmet V. 2.4 (Partec GmbH). 1C-værdien af P. dactylifera (Mbp) blev beregnet som: (gennemsnitlig spidsposition for P. dactylifera/gennemsnitlig spidsposition for P. crispum)liter 2201 Mb (=1C-værdi af P. crispum) 63.

Gvar panel

Fænotypebestemmelse for GVAR blev udført på daddelpalmer beliggende på to gårde i De Forenede Arabiske Emirater. Gårdene er placeret på Date Palm Research Center i Hamriyah, Ras Al-Khaimah (n = 46) og i Al-Shuaib, Al-Ain, Abu Dhabi (n = 111) . Befolkningen består primært af kvindelige kommercielle sorter (n = 145). Hanner (n = 12), der voksede på gårdene, blev også sekventeret primært med det formål at kortlægge det kønsbestemmende locus.

khalal fase frugtprøver blev indsamlet fra forår til efterår i 2016, og enten snap frosset på flydende nitrogen til RNA-sekventering eller indsamlet som friske frugter til fotografering, scanning (se nedenfor) og karakterisering af andre frugtegenskaber. Tamar scenefrugter fra de samme træer blev samlet i sommeren 2017 til sukker-og organisk syreprofilering. Bladprøver blev indsamlet til DNA-ekstraktion og genomsekventering.genomisk DNA blev ekstraheret fra enten blad eller frugt mesocarp/epicarp væv ved hjælp af plant DNeasy mini kit (Chiagen, Venlo, Holland). DNA-ekstraktionskolonner og biblioteker udarbejdet ved hjælp af Illumina næste (San Diego, CA) kit. En 2-liters 100 bp-parret sekventering blev udført på en Illumina Hisek 2500-sekvensator med op til otte biblioteker pr. Læsninger blev demultiplekset, og de, der passerede Illumina kvalitetskontrolfiltre, blev behandlet med Trimmomatic45 (v. 0.36) for at fjerne forurenende adaptersekvenser. Til fjernelse af adapteren brugte vi adapteren og den næste transposasesekvensdatabase, der fulgte med Trimmomatic (v. 0.32), med følgende indstilling ILLUMINACLIP: list adapterbibliotek list:2:30:10 MINLEN:76 for kun at beholde læsepar, hvor begge læsninger var 76 bps eller længere efter trimning.

læser blev justeret til den ikke-maskerede BC4 – mandlige samling (kun primære contigs) ved hjælp af mem mem (v. 0.7.15-r1140 ). Mem aligner blev kørt med-M mulighed for at markere supplerende læser (0 LR 800 bitvis flag) som sekundær (0 LR 100). Prøvejusteringer blev behandlet med Rettelsesinformation (Picard-tools v. 2.8.2; http://broadinstitute.github.io/picard) for at sikre konsistens i parret Læs information, SamSort (Picard-tools v. 2.8.2) for at koordinere-sortere justeringerne, MarkDuplicates (Picard-tools v. 2.8.2) for at markere duplikerede læsepar og med gatk64 IndelRealignerTargetCreator/IndelRealigner tool (gatk V. 3.7-0) at justere læser i Indel regioner. Prøvejusteringer blev valideret ved hvert trin ved hjælp af ValidateSam (Picard-tools v. 2.8.2) for at sikre ingen fejl i produktionen. Behandlede justeringer blev opsummeret med CollectAlignmentSummaryMetrics (Picard-tools v. 2.8.2) og Samtools .

SNP-opkald og genotypebestemmelse

SNP-opkald og genotypebestemmelse blev udført med gatk (v. 3.7-0) HaplotypeCaller-kørsel i gvcf-tilstand efterfulgt af fælles genotypebestemmelse med GenotypeGVCFs . Læsninger blev filtreret fra haplotypecaller-trinnet for at udelukke dem med en kortlægningskvalitet mindre end 20 og for at udelukke dem, der er markeret som polymerasekædereaktion (PCR) duplikater eller sekundære justeringer (se ovenfor). Denne tilgang gav 32.384.028 SNP ‘ er på tværs af alle prøver. SNP-filtrering blev udført ved at anvende hårde filtre på de rå varianter ved hjælp af GATK v. 4.0.2.1. Vi filtrerede det rå opkaldssæt for at udelukke SNP ‘ er med lav (<785) og høj dybde (>2862) opsummeret på tværs af prøver. Vi udelukkede også multialleliske SNP ‘er, SNP’ er inden for 10 bp af Indel-polymorfier og SNP ‘ er, der opfyldte følgende betingelser: kval < 30 og KVD < 5.0. Genotyper blev indstillet som manglende, hvis DP var under 5 eller over 20, såvel som SNP ‘ er med en genotype call rate < 80% eller en mindre allelfrekvens under 0,01. Vi estimerede en p-værdi for hvert sted fra en hårdfør Ligevægtstest ved hjælp af VCFtools65 og filtrerede SNP ‘ er ud, der viser et overskud i heterosygositet (nøjagtig test, P < 0.05). Denne procedure gav et filtreret opkaldssæt på 7.149.205 SNP ‘ er.

statistisk analyse

Al statistisk analyse blev udført på sproget r statistical computing, medmindre andet er angivet.

ld-analyse

LD blev estimeret ved hjælp af en metode til estimering af r2, der er passende for ikke-udfasede data (se VCFtools65). Ld-henfaldskurven for GVAR-panelet blev beregnet som i blomster et al.4. Kort fortalt blev r2 beregnet for ikke–fasede SNP ‘ er med mindre allelfrekvens større end 10% ved hjælp af indstillingen-geno-ld i VCFtools (v. 0.1.14). Henfaldskurver blev genereret ved at tilpasse en kurve til de parvise R2-estimater ved fysisk afstand mellem SNP-par med ikke-lineære mindste firkanter ved hjælp af en tilgang tilpasset fra Marroni et al.66. Halvforfaldsafstanden blev derefter beregnet som den afstand, hvor r2 er halvdelen af dens maksimale værdi (dvs.1 bp-afstand).

karakterisering af frugtfarve

otte frugter fra khalalstadiet fri for skade pr.daddelpalme sort blev høstet, skyllet med ledningsvand for at fjerne støv og derefter lufttørret. Frugterne blev skåret i længderetningen, og frugtfarve blev derefter målt ved hjælp af to strategier. Først fotograferede vi de skivede frugter med en farvekontrol i en kamerafotostudieboks, hvor billederne blev taget på en hvid baggrund med et digitalt kamera. Farven på frugten blev analyseret med ImageJ softvare67 ved hjælp af RGB-farveparametrene.

for det andet brugte vi en komplementær tilgang, hvor vi brugte tomatanalysator programmel68 v. 2.2 for at opnå estimater af farveparametre L*, A*, b*. L * – koordinaten udtrykker mørket og lysheden i farven og spænder fra sort (0) til hvid (100). Koordinater A* og b * udtrykker farveretning, hvor + A* er i den røde retning, −a* i den grønne retning, +b* i den gule retning og −b * i den blå retning68. Billedindsamling og analyse blev udført som beskrevet i Rodr et al.27. Skivede frugter blev placeret på en scanner med en sort baggrund og dækket for at undgå virkningerne af omgivende lys. Scannede billeder blev gemt som JPEG-filer, og estimaterne af farveparametre L*, A*, b* blev udført på hver frugt. Gennemsnittet af alle frugter blev beregnet. De to metoder var stærkt korrelerede, så vi brugte farveindeks a*/b* for at evaluere forskellene i hudfarver på frugterne og brugte det til foreningsundersøgelsen.

frugtantocyaninindhold

Total anthocyanin blev ekstraheret fra tre replikater af khalalstadiumfrugt fra hver dadelpalme-sort ved anvendelse af frugter, der er frosset på flydende nitrogen efter proceduren beskrevet i Rabino og Mancinelli69 med mindre modifikation. Kort fortalt blev anthocyanin fra frosset frugthud (100 mg) formalet til fint pulver og ekstraheret i 1 ml sur methanol (1% HCI) ved inkubation ved stuetemperatur i mørke i 18 timer efterfulgt af centrifugering i 10 minutter ved 12.000 g. Kvantificering af total anthocyanin blev udført ved hjælp af absorbansen målt ved et spektrofotometer ved hjælp af ligningen

Total anthocyanin = (A530-0,25 liter A657) / FV, hvor A530 og A657 nm er absorbansen, og FV er den våde vægt af plantematerialet (g).

frugtstørrelse

Frugtfotografier anvendt til farveanalyse (se ovenfor) inkluderede en lineal som størrelsesstandard. ImageJ67 (v. 2) og tomat analysator programmel27 blev derefter brugt til at estimere frugt længde og bredde.

frugtsukker og syreindhold

frugt saccharose, glukose og fruktose blev kvantificeret fra 125 sorter på tamarstadiet, når frugterne er tørre, modningen er afsluttet, og det stadium, hvor datoer typisk indtages. Frugter blev snapfrosset ved -20 liter C, og mellem 10 og 15 frugter pr.sort blev straks opretholdt ved -20 liter C ved ankomsten til Montpellier (fransk Landbrugsforskningscenter for International udvikling, CIRAD), hvor der blev udført højtydende væskekromatografianalyse. En enkelt måling fra to samlede frugter blev opnået for hvert af sukker-og syreegenskaberne. Datostykker (uden stenen) blev frosset med flydende nitrogen og formalet i pulver, anbragt i to separate stramme hætteglas, opbevaret ved -20 liter C indtil prøveudtagning. For tørstoffet, i to eksemplarer, 1 g prøve blev vejet og anbragt i en komfur under vakuum ved 70 kg C i 72 h. en kontrol blev kontrolleret i 4 dage for at bestemme den optimale varighed. Sukkerekstraktioner blev udført ved hjælp af metoden tilpasset fra Bchir et al.70. For hver prøve blev 500 mg dadelpasta og 10 ml 80% ethanol anbragt i et 15 ml rør, opvarmet i 5 minutter ved 80 liter C i et vandbad. Hvert rør blev derefter omrørt først manuelt og derefter mekanisk i 15 minutter for bedre spredning. Efter centrifugering ved 9000 liter g (Avanti J-e centrifuge; Beckman-Coulter, Brea, CA, USA) blev bunden ekstraheret to gange, og supernatanterne blev samlet, filtreret ved 0,45 liter og injiceret. Metoden blev testet med surt vand (0,01 N H2SO4). Prøvestandarder var Sigma-Aldrich (St. Louis, MO, USA) blev brugt.

frugtfugtighedsindhold

frugtprøveudtagning blev udført som i afsnittet om frugtsukker og syreindhold ovenfor. Datomasse fra to frugter blev genvundet og formalet med flydende nitrogen for at homogenisere prøven og opbevaret ved -80 liter C for at opnå en enkelt måling pr. Fugtindholdet blev gravimetrisk bestemt ved at måle vægttabet på 2,5 g datopulpeprøver, tørret ved 70 liter C, indtil prøverne nåede en stabil vægt.

genom-dækkende associeringsanalyse

Vi kørte den genom-dækkende associeringskortanalyse ved hjælp af gapit R package25. For beregningseffektivitet og for at minimere problemer med flere test, men give tæt dækning med hensyn til ld-forfaldsafstanden, brugte vi et 5.5% nedprøvet tilfældigt SNP-sæt (392,948 SNP ‘ er). En CMLM26 ved hjælp af både befolkningsstruktur og slægtskabsinformation som kovariater blev udført på genotyperne fra de 157 datapalmprøver. Populationsstrukturen blev udledt med en principal component analysis (PCA) genereret af Gapit ved anvendelse af 1% af SNP ‘ erne (tilfældigt samplet). Gapit anvendte yderligere de første fem komponenter i PCA (Fig. 1a; supplerende Data 2). Slægtskab blev udledt ved hjælp af VanRaden-algoritmen (supplerende Data 3). Signifikante SNP ‘ er blev identificeret ved hjælp af en konservativ Bonferroni-tærskel på P < 1.27 til 10-7. For træk med signifikante resultater, vi udførte yderligere en anden GVAR-analyse ved hjælp af det fulde SNP-sæt på bestemte LGs, hvor signifikante SNP ‘ er blev identificeret.

karakterisering af Ibn Majid og vir-genet

Vi har tidligere identificeret en copia-lignende retrotransposon-indsættelsespolymorfisme i ekson 3 af en r2r3-MYB-transkriptionsfaktor13 (NCBI-Gen-ID: LOC103717680), der er ortolog til virescens (vir) genet i oliepalme28. For at karakterisere denne retrotransposon forstærkede vi elementet lange terminale gentagelser (såvel som tilstødende vir-gensekvens) i Thory og kejserinde Sorter indsamlet fra USDA farm i Thermal, Californien og USDA/UC Riverside farm henholdsvis ved hjælp af PCR-kernesystemer (Promega, Madison, Vi USA) buffer og polymerase.

primerparene 5′-TGT GTC CGG CAT TGC ACT TCT-3′ (fremad) og 5′-GCT CAA TGT TGT TGT TGT TGT TGG-3′ (omvendt) blev brugt til 5′ LTR og 5′-ACTC TGA CTA CCA AGT ACT TGA TG-3′ (fremad) og 5′-CTG CAC TAT tat CAC agt AGA TGG-3′ (omvendt) for 3′ ltr. Forstærkede produkter blev sendt til Sanger-sekventering kl. Vores genomsamling indeholder også en komplet kopi af indsættelsen (~11,7 kb). BLAST blev brugt til at justere indsættelsen mod sig selv for at identificere de matchende lange terminale gentagelsesregioner. Programmet LTRdigest71 blev brugt til at bekræfte BLASTRESULTATERNE. En BLAST søgning forespurgt den fulde Ibn Majid sekvens mod dato palme genom til at bestemme kopi nummer.

supplerende Tabel 11 giver koordinater for vores manuelle annotation af Vir genet i BC4 mandlige samling. Genotypebestemmelse af Ibn Majid-indsættelsen i VIR ekson 3 i daddelpalme sorter blev udført ved manuel inspektion af justerede læsninger, der spænder over indsættelsesområdet i Jbrose72. Da BC4-genomsamlingen har indsættelsesallelen (Virim, se Fig. 3), kortlagte læsninger, der stammer fra vildtype (VIR+) eller alleler, der ikke er indsat, er blødt klippet ved ekson 3-indsættelsesgrænsen. Vi scorede tilstedeværelsen af blødklippede læsninger (understøtter tilstedeværelsen af en vir+ allel) eller ikke-klippede læsninger, der spænder over ekson 3-indsættelsesgrænsen (understøtter tilstedeværelsen af en virim-indsættelsesallel) for at identificere genotyper. Vi gentog denne procedure ved at undersøge læsejusteringer i både 5′ og 3′ enderne af indsættelsen i BC4-hansamlingen og prøver, hvor både 5′ og 3′ genotyper gav matchende genotyper blev bevaret til analyse. I betragtning af vores interesse for frugtfarvefænotyper genotypede vi kun kvindelige palmer.

karakterisering af invertaser og deletion polymorfier

undersøgelse af gener i sukkersammensætningen KVTL på LG 14 (supplerende Data 6) afslørede oprindeligt tre positionskandidater—en alkalisk / neutral invertase (chr14G0028200) og to tilstødende cellevægsinvertaser (chr14G0022900 og chr14G0023100) forudsagt af vores genanmærkningsrørledning. Vi kontrollerede for potentielle yderligere ikke-noterede kopier af invertase i denne region ved at tilpasse forudsagte udskrifter for hvert af de tre gener til denne region ved hjælp af Splign-transkriptet til genomisk justeringsværktøj73. Dette gendannede en minus streng sekvens (som vi omtaler som CVINV2) med tæt homologi til de flankerende invertaser CVINV1 og CVINV3 ved 2.489.373 til 2.485.592, men flere indsættelser/sletninger i regioner, der er homologe med invertase CDS-eksoner.

Dækningsdybde for sletningsvariationsanalyse blev bestemt i 500 BP ikke-overlappende beholdere med samtools bedcov74 (v. 1.9) brug af standardindstillinger. Rådybdeværdier blev normaliseret uafhængigt for hver prøve ved at dividere den rå dybde af hver skraldespand med den mediane rå dybde af alle skraldespande på LG 14 efterfulgt af log2-transformation efter Blomster et al.75. Prøver blev genotypet til homosygøs deletion og alternative genotypeklasser for 40 kb-deletionen ved manuel inspektion af supplerende Fig. 12. Homosygøse genotyper til deletion opstrøms for A / N-INV1 (Fig. 4, Supplerende Fig. 13) blev kaldt ved at indstille en tærskel, der kræver, at mindst et 500 bp-interval i 5 kb-sletningsområdet har log2 normaliseret dybde mindre end -5. På nuværende tidspunkt er det ikke muligt at skelne heterosygoter til sletning alleler fra indsættelse homosygoter på grund af den moderate dækning i Vores re-sekventeringsdata.

Invertaseanalyse

der blev valgt to sorter af saccharose og to reducerende sukkersorter til invertaseanalysen. Forsøget blev udført på to dage med alle fire sorter repræsenteret af en enkelt frugt på hver dag. Analyser blev udført på et khalal-Stadium frugt snapfrosset på indsamlingstidspunktet (se ovenfor) efterfulgt af opbevaring ved -80 K. Råekstrakter blev opnået fra den frosne datofrugt efter protokollen fra Hasegava og Smolensky33. Hver frosne frugt blev pulveriseret med mørtel og støder (med frø fjernet) og derefter malet i en køkkenblender og 5 g anbragt i kold ekstraktionsbuffer (20 ml 4,0% NaCl, 1 g polyvinylpyrrolidon, PVP). Et yderligere macerationstrin blev udført i en laboratoriehomogenisator i 1-2 minutter. Ekstraktet blev derefter centrifugeret ved 20.000 liter g i 15 minutter ved 4 liter C. supernatanten indeholdende opløselig invertase blev opbevaret på is, og resten centrifugeret en anden gang ved 20.000 liter g i 15 minutter ved 4 liter C. supernatanterne blev kombineret og 10 ml dialyseret mod koldt vand ved 4 liter natten over for at fjerne sukker fra ekstraktet. Prøven blev derefter delt, og halvdelen af prøven kogte ved 100 liter C for at måle baggrundsaktivitet fra potentielt forurenende sukker fra frugten. Invertaseaktivitet af ukogte og kogte råekstrakter blev derefter målt ved kolorimetrisk analyse på en Synergy H1-mikropladelæser med et koblet analysesæt (Sigma-katalognr. MAK118) efter producentens anvisninger.

frugt RNA-Sekv analyse

to RNA-Sekv datasæt blev indsamlet for at løse spørgsmål om frugtudvikling og variation i frugtegenskaber. RNA-SEK på forskellige frugtudviklingsstadier blev udført på frugter indsamlet i 2014 fra replikerede træer beliggende på grund af De Forenede Arabiske Emiraters Universitet, Date Palm Tissue Culture Laboratory i Al-Ain, UAE. Til dette forsøg blev tre eller fire separate træer af Khenesi (en sort med rød frugt) og Khalas (gul frugt) sorter udtaget gentagne gange ved 45, 75, 105, 120 og 135 dage efter bestøvning og frugter snapfrosset på flydende nitrogen. RNA blev ekstraheret fra en enkelt frugt fra hver tre eller flere træer pr.sort efter standardprotokoller til forberedelse af Biblioteksbiblioteket og 2 til 101 bp parret sekventering udført på en Illumina Hisek 2500.

et andet eksperiment blev udført på khalal-scenefrugt indsamlet på Al-Shuaib-gården i 2016. Tre frugter blev opsamlet fra hver af otte palmer hver af en anden sort valgt ud fra, at de var ved eller tæt på ekstremerne af saccharose og reducerende sukkertypefordelinger (dvs.høj og lav saccharosekoncentration). Frugter blev behandlet som beskrevet ovenfor, og biblioteker konstrueret med næste bibliotek forberedelsessæt (Illumina) og 2 liter 76 BP parret-ende sekventering udført på et næste (Illumina) instrument.

Differentialekspressionsanalyse blev udført ved trimning af rå sekventering læser med Trimmomatic45 (v 0.36) med parametre ILLUMINACLIP: liter adapter fasta:2:30:10 efterfølgende:3 førende:3 glidevindue:4:15 MINLEN:36. Læser blev derefter justeret til BC4 mandlige referencegenom med STAR split read aligner47 (v. 2.5.3a) og læsetællinger genereret pr. gen ved at tage foreningen af eksoner med htseks-count76 (v. 0.9.1) indstillet til kun at omfatte entydigt kortlagte læsninger (dvs. Read count normalisering blev udført med median-of-ratio-metoden i Desek277 (v. 1.8.2). Test af differentiel ekspression af virescens (Pdac_HC_chr4G0137100) mellem røde (Khenesi, n = 3 replikatbiblioteker) og gule (Khalas, n = 3 eller 4 replikatbiblioteker) sorter blev udført separat for hvert af frugtudviklingstidspunkterne 45, 75, 105, 120 og 135 dage efter bestøvning. P-værdier rapporteres for en Valds test af hypotesen om ingen foldeforskel mellem Khenesi og Khalas udtryk på hvert trin.analyse af differentiel genekspression af invertaser a/N-INV1, CVINV1 og CVINV3 (Pdac_HC_chr14G0028200, Pdac_HC_chr14G0022900 og pdac_hc_chr14g0023100 henholdsvis) mellem saccharose (n = 4 sorter) og reducerende sukkertyper (n = 4 sorter) blev udført ved at bygge tre biblioteker pr.sort fra RNA ekstraheret uafhængigt af tre forskellige frugter efterfulgt af sekventering af hvert bibliotek. Analyse af differentiel ekspression mellem sorter af saccharose-type og reducerende type blev derefter udført ved at justere læsninger med stjerne (se ovenfor), tælle læser med htseks-tælling og generere rå tællematricer i Desek2. Gen blev derefter opsummeret på tværs af biblioteker for hver sort på grund af lave læsetællinger i nogle biblioteker. Efterfølgende analyse blev udført ved først at droppe gener med lavt antal (gener med <10 læser opsummeret på tværs af alle 8 prøver) efterfulgt af standard Desek2 (v. 1.22.2) arbejdsstrøm med fire biologiske replikater (dvs., dato palm sorter) i hver behandlingsgruppe. Ukorrigerede p-værdier for hypotesen om ingen differentiel ekspression præsenteres i hovedteksten for tre kandidatgener.

Rapporteringsoversigt

yderligere oplysninger om forskningsdesign findes i Nature Research Reporting Summary, der er knyttet til denne artikel.