Articles

Genom-wide association kartlegging av dato palm frukt egenskaper

Genomsekvensering AV BC4 mannlige

Vi samplet en backcross mannlige date palm ligger På United States Department Of Agriculture (USDA)/University Of California, Riverside farm I Thermal, California (USDA tiltredelse Nr. PI 555415, Kilde RIV 7545 PL). Denne hanen ble produsert av fire generasjoner av backcrossing med En Barhee-kvinne som tilbakevendende foreldre som en del AV et avlsprogram VED USDA, USA som ble avviklet i 1970S10, 18. Brosjyrer ble rengjort og snap frosset på flytende nitrogen før transport Til Arizona Genomics Institute (University Of Arizona, Tucson, AZ) for utvinning AV DNA MED HØY molekylvekt OG sekvensering.

genomet TIL BC4-hannen ble sekvensert ved Hjelp Av En PacBio RSII-sekvenseringsplattform. DNA MED HØY molekylvekt for sekvensering ble ekstrahert fra unge blader ved å vedta Protokollen Til Doyle og Doyle42 med mindre modifikasjoner. Pacbio bibliotek forberedelse fulgte 20 kb protokollen og tre biblioteker (gel-valgt på 20, 25 og 30 kb) ble bygget. Åttifem SMRT-celler ble sekvensert på EN RSII-sequencer med filminnsamlingstid på 6 timer. omtrent 6,4 millioner leser ble generert, totalt 72 Gb data (gjennomsnittlig subread lengde 11,2 kb, N50 18,5 kb). Ytterligere sekvensering av et kort innsatsbibliotek (2 × 100 bp sammenkoblet) ble utført med En Illumina HiSeq 2500 sequencer.

Genome assembly

Vi gjorde en k-mer-basert estimering av genomet størrelse fra rå kort lese sekvenser AV BC4 mannlige genomet for montering formål (KmerFreq_AR I SOAPdenovo243) med standardinnstillinger og k-mer lengde satt til 17. Merk at et eksperimentelt genomstørrelsesestimat for P. dactylifera også ble gjort ved bruk av flowcytometri (se nedenfor). PacBio leser ble deretter samlet MED FALCON-Unzip19 (v. falcon-2017.06.28–18.01-py2. 7-ucs2) med en frødekning på 55× og det k-mer-baserte genomstørrelsesestimatet på 774 Mb som inngang. Unzip-modulen ble kjørt med standardinnstillinger.den resulterende samlingen ble polert ved å samkjøre rå PacBio leser Med Kogger Og Pil (en del AV SMRT Analyse suite v. 2.3.0) etterfulgt av å kjøre Pilon44 v. 1.18 Med Illumina kort lese sekvenser FRA BC4 hann. Innganger Til Pilon ble produsert ved å trimme den korte leser Med Trimmomatic45 (v. 0.32) for å fjerne 3 ‘ baser under basekvaliteten På Q30 og leser kortere enn 30 nukleotider. Leser ble deretter justert til Utgangen Av Pilen Med Bowtie246 (v. 2.2.6).

de polerte primære contigs ble forankret Til LGs av eksisterende genetisk map21 MED ALLMAPS22 å produsere en forankret haploid montering. Stillasekvenser for det genetiske kartet ble hentet fra http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gz. Ved justering til det genetiske kartet og etter manuell inspeksjon av omstillingen av raw leser til forsamlingen, fant vi bare en forekomst av mis-montering: en contig måtte deles siden to contig ender ble fusjonert head-to-head.

Genom annotasjon

vi genererte RNA-Seq biblioteker fra flere khalal scenen frukt (se nedenfor), en blanding av mannlige og kvinnelige blomsterknopper (referert til som «blomst» nedenfor), og pollen, og gjennomført 2 × 100 bp paret-end sekvensering På En Illumina HiSeq 2500 instrument (Supplerende Tabell 7). Ytterligere dato palm RNA-Seq data fra blad og rot ble lastet ned Fra Sekvensen Lese Arkivet (Supplerende Tabell 7). RNA-Seq leser ble trimmet Med Trimmomatic45, justert til haploid montering MED STAR47 (V. 2.4.0.1), og genmodeller spådd Av StringTie48 (v. 1.3.2) skal brukes som trening For Augustus49(v. 2.3).

Genanotasjon ble utført ved BRUK AV MAKER2-rørledningen 50 (v. 2.31). Homologibasert bevis, inkludert 7097 ESTs (lastet ned fra NCBI EST-databasen 9. februar 2017), proteinsekvenser fra Uniprot51, en daddelpalme proteom , en oljepalme proteome52, OG rna-Seq-avledede modeller ovenfra. Ab initio prediksjon ble utfort Med Augustus (v. 3.0) trent som beskrevet I Bowman et al.53 med genmodeller produsert Med StringTie48 (v. 1.3.2), FRA RNA-Seq-justeringene.den rå MAKER2-merknaden ble analysert, fjernet modeller som inneholdt te-domener og manglet bevis på transkripsjon eller tilstedeværelse av Et Pfam-domene som beskrevet I Bowman et al.53. Med om 1× av ikke-organellar single-end Wgs Illumina leser, en de novo (non assembly-baserte) gjenta bibliotek ble produsert Med RepeatExplorer54, og analysert som I Copetti et al.55. Gjenta annotering av forsamlingen ble utfort Med RepeatMasker (v. 4.0.6; i nukleotidrom) og Blaster56 (del AV REPET v 2.5-pakken, i proteinrom) og senere avstemt i en enkelt annotasjonsfil. Ikke-kodende Rna ble spådd Med Infernal57 (v. 1.1.2) Med Rfam library58 (v. 12.2). Treff over e-verditærskelen på 1 × 10-5 ble filtrert ut, samt resultater med score lavere enn den familiespesifikke samlingsterskelen. Når loci på begge strengene ble spådd, ble bare treffet med høyest poengsum holdt. Overføring Rna ble også spådd ved hjelp av tRNAscan-SE59 (v. 2.0) med standardparametere.

Genom kvalitetsvurdering

Visualiseringer av genomet montering ble produsert med assembly-stats programvare (Supplerende Fig. 1, ). Assembly fullstendighet ble evaluert ved å karakterisere genet plass MED BUSCO20 ved hjelp av 1440 plante ortholog grupper (v. 3) og ved å samkjøre ESTs til diploid montering Med Blat60 (v. 350).

estimering av datopalmgenomstørrelse

genomstørrelsen ble estimert ved hjelp av en-trinns flowcytometri-prosedyre beskrevet i Dolež et al.61 med små endringer. Kort, ca 1 cm2 av bladmateriale fra to P. dactylifera-prøver på Royal Botanic Gardens, KEW, UK-samlingen ble inkubert i 30 s på is i 1 ml «general purpose buffer» (GPB)62 supplert med 3% PVP-40 for å myke bladet. Deretter en tilsvarende mengde blad materiale av kalibreringsstandarden Petroselinum crispum(Mill.) Fuss (1c verdi = 2201 Mb) 63 ble tilsatt og det kombinerte materialet ble hakket raskt (men ikke for kraftig) ved hjelp av et nytt barberblad. Ytterligere 1 ml AV GPB-bufferen ble tilsatt, og deretter ble homogenatet filtrert gjennom et 30 µ nylonnett (Celltrics 30 µ mesh, Sysmex, Goritz, Tyskland) i et rør, 100 µ propidiumjodid (1 mg/mL) ble tilsatt, og prøven ble inkubert på is i 10 min. Den relative fluorescensen av 5000 partikler ble registrert ved Bruk Av Et Partec Cyflow SL3 flowcytometer (Partec GmbH, Mü, Tyskland) utstyrt med en 100 mW grønn solid state laser (532 nm, Cobolt Samba, Solna, Sverige). Tre replikater av hvert blad ble behandlet, og utgangshistogrammene ble analysert ved Hjelp Av FlowMax-programvaren v. 2.4 (Partec GmbH). 1c-verdien Av P. Dactylifera (Mbp)ble beregnet som: (Gjennomsnittlig toppposisjon Av P. dactylifera/Gjennomsnittlig toppposisjon Av P. crispum) × 2201 Mb (=1c-verdi Av P. crispum)63.

GWAS panel

Fenotyping FOR GWAS ble utført på dato palmer ligger på to gårder i De Forente Arabiske Emirater. Gårdene ligger På Date Palm Research Center I Hamriyah, Ras Al-Khaimah (n = 46) og I Al-Shuwaib, Al-Ain, Abu Dhabi (n = 111) . Bestanden består hovedsakelig av kvinnelige kommersielle varianter (n = 145). Hannene (n = 12) som vokste på gårdene ble også sekvensert primært for å kartlegge kjønnsbestemmende lokus.Khalal stadium fruktprøver ble samlet fra vår til høst i 2016, og enten snap frosset på flytende nitrogen FOR RNA-sekvensering eller samlet som frisk frukt for fotografering, skanning (se nedenfor) og karakterisering av andre frukttrekk. Tamar stage frukt fra de samme trærne ble samlet sommeren 2017 for sukker og organisk syre profilering. Bladprøver ble samlet INN FOR DNA-ekstraksjon og genomsekvensering.Genomisk DNA ble ekstrahert fra enten blad eller frukt mesocarp/epicarp vev ved hjelp Av plante DNeasy mini kit (Qiagen, Venlo, Nederland). DNA utvinning kolonner, og biblioteker forberedt Med Illumina Nextera (San Diego, CA) kit. En 2 × 100 bp sammenkoblet sekvensering ble utført På En Illumina HiSeq 2500 sequencer med opptil åtte biblioteker per kjørefelt. Leser ble demultiplexed og de passerer Illumina kvalitetskontroll filtre ble behandlet Med Trimmomatic45 (v. 0.36) for å fjerne forurensende adapter sekvenser. For adapterfjerning brukte vi adapteren og Nextera transposase-sekvensdatabasen som følger Med Trimmomatic (v. 0.32) nedlasting med følgende innstilling ILLUMINACLIP:〈adapterbibliotek〉: 2: 30: 10 MINLEN: 76 for å beholde bare lesepar hvor begge leser var 76 bps eller lenger etter trimning.

Leser ble justert TIL den umaskerte BC4 mannlige forsamlingen (kun primære kontigs) ved hjelp av bwa mem (v. 0.7.15-r1140). Bwa mem aligner ble kjørt med-M muligheten til å markere tilleggslesninger (0 × 800 bitvis flagg) som sekundær (0 × 100). Sample alignments ble behandlet Med FixMateInformation (Picard-tools v. 2.8.2; http://broadinstitute.github.io/picard) for å sikre konsistens i sammenkoblet leseinformasjon, SamSort (Picard-tools v. 2.8.2) for å koordinere-sortere justeringene, MarkDuplicates (Picard-tools v. 2.8.2) for å flagge dupliserte lesepar, og MED GATK64 IndelRealignerTargetCreator/IndelRealigner tool (gatk v. 3.7-0) For Å Justere leser i indel-regioner. Sample justeringer ble validert på hvert trinn Ved Hjelp ValidateSam (Picard-tools v. 2.8.2) for å sikre ingen feil i produksjonen. Behandlede justeringer ble oppsummert Med CollectAlignmentSummaryMetrics (Picard-tools v. 2.8.2) og Samtools .

SNP calling og genotyping

SNP-calling og genotyping ble utført med GATK (v. 3.7-0) haplotypecaller i GVCF-modus etterfulgt av joint-genotyping Med GenotypeGVCFs . Lesing ble filtrert fra haplotypecaller-trinnet for å utelukke de med en kartleggingskvalitet mindre enn 20 og å ekskludere de som er merket som polymerasekjedereaksjon (PCR) duplikater eller sekundære justeringer (se ovenfor). Denne tilnærmingen ga 32,384,028 SNPs på tvers av alle prøvene. SNP-filtrering ble utført ved å bruke harde filtre til råvarianter ved HJELP AV GATK v. 4.0.2.1. Vi filtrerte råanropssettet for å utelukke SNPs med lav (<785) og høy dybde (>2862) oppsummert over prøver. Vi ekskluderte også multialleliske Snper, Snper innenfor 10 bp av indel polymorphisms, Og Snper som oppfyller følgende betingelser :QUAL <30 OG QD< 5.0. Genotyper ble angitt som manglende hvis DP var under 5 eller over 20, Samt SNPs med en genotype call rate < 80%, eller en mindre allelfrekvens under 0,01. Vi estimerte En p-verdi for hvert område fra En Hardy-Weinberg Likevektstest ved Hjelp Av VCFtools65 og filtrerte Ut SNPs som viser et overskudd i heterozygositet (eksakt test, P< 0,05). Denne prosedyren ga et filtrert anropssett på 7.149.205 SNPs.

Statistisk analyse

all statistisk analyse ble utført I r statistisk computing språk med mindre annet er angitt.

ld analyse

LD ble estimert ved hjelp av en metode for å estimere r2 som er egnet for ikke-fasede data (se VCFtools65). LD forfall kurve FOR GWAS panelet ble beregnet som I Flowers m.fl .. 4. Kort sagt ble r2 beregnet for ikke-fasede Snper med mindre allelfrekvens større enn 10% ved bruk av-geno-ld-alternativet I VCFtools (v. 0.1.14). Forfall kurver ble generert ved å montere en kurve til de parvise r2 estimater av fysisk avstand mellom SNP par med ikke-lineære minste kvadrater ved hjelp Av en tilnærming tilpasset Fra Marroni m.fl .. 66. Half-decay avstanden ble deretter beregnet som avstanden der r2 er halvparten av sin maksimale verdi(dvs. 1 bp avstand).

Karakterisering av frukt farge

Åtte khalal scenen frukt uten skade per dato palm variasjon ble høstet, skylles med vann fra springen for å fjerne støv og deretter lufttørket. Fruktene ble skåret i lengderetningen, og fruktfarge ble deretter målt ved hjelp av to strategier. Først fotograferte vi de skivede fruktene med en fargekontroll i en kamerafotostudio-boks, hvor bildene ble tatt på en hvit bakgrunn med et digitalkamera. Fargen på frukten ble analysert Med ImageJ software67 ved HJELP AV RGB – fargeparametrene.For Det Andre brukte Vi en komplementær tilnærming, der vi brukte Tomatanalysatorprogramvare68 v. 2. 2 for å få estimater av fargeparametere L*, a*, b*. L * – koordinaten uttrykker mørket og lysheten i fargen og varierer fra svart (0) til hvitt (100). Koordinerer a * og b * express farge retning, hvor + a * er i rød retning − – a * i grønn retning, + b * i gul retning og-b * i blå retning68. Bildeoppkjøp og analyse ble gjort som beskrevet i Rodrí Et al.27. Skivede frukter ble plassert på en skanner med svart bakgrunn og dekket for å unngå effekten av omgivende lys. Skannede bilder ble lagret SOM JPEG-filer og estimatene av fargeparametere L*, a*, b* ble gjort på hver frukt. Gjennomsnittet av all frukt ble beregnet. De to metodene var svært korrelerte, så vi brukte fargeindeks a*/b* for å evaluere forskjellene i hudfarger av fruktene og brukte det til foreningsstudien.

antocyanininnhold av frukt

totalt antocyanin ble ekstrahert fra tre replikater av khalal-stadium frukt fra hver daddelpalme ved bruk av frukt snap-frosset på flytende nitrogen etter prosedyren beskrevet I Rabino og Mancinelli69 med mindre modifikasjon. Kort sagt ble anthocyanin fra frossen frukthud (100 mg) malt i fint pulver og ekstrahert i 1 ml sur metanol (1% HCl) ved inkubering ved romtemperatur i mørket i 18 timer, etterfulgt av sentrifugering i 10 min ved 12.000 g. Kvantifisering av totalt anthocyanin ble gjort ved hjelp av absorbansen målt med et spektrofotometer ved hjelp av ligningen

Total anthocyanin = (A530-0,25 × A657) / FW, Hvor A530 og A657 nm er absorbansen og FW er den våte vekten av plantematerialet (g).

Fruktstørrelse

fruktfotografier brukt til fargeanalyse (se ovenfor) inkluderte en linjal som standardstørrelse. ImageJ67 (v. 2) Og Tomat analyzer software27 ble deretter brukt til å estimere frukt lengde og bredde.Fruktsukker og syreinnhold

fruktsukrose, glukose og fruktose ble kvantifisert fra 125 varianter på tamar-scenen når fruktene er tørre, modningen er fullført og scenen hvor datoer vanligvis forbrukes. Frukt ble snap-frosset ved -20 hryvnias C Og mellom 10 Og 15 frukter per variasjon ble umiddelbart opprettholdt ved -20 hryvnias C ved ankomst Til Montpellier (French Agricultural Research Centre For International Development, CIRAD) hvor væskekromatografianalyse med høy ytelse ble utført. En enkelt måling fra to sammenslåtte frukter ble oppnådd for hver av sukker-og syreegenskapene. Datostykker (uten steinen) ble frosset med flytende nitrogen og malt i pulver, satt i to separate tette glassflasker, lagret ved -20 °C til prøvetaking. For tørrstoffet, i to eksemplarer, ble 1 g prøve veid og plassert i en komfyr under vakuum ved 70 °C i 72 h. en kontroll ble kontrollert i 4 dager for å bestemme optimal varighet. Sukkerekstrakter ble utført ved hjelp av metoden tilpasset Fra Bchir et al.70. For hver prøve ble 500 mg datopasta og 10 ml 80% etanol plassert i et 15 ml rør, oppvarmet i 5 min ved 80 °C i et vannbad. Hvert rør ble deretter omrørt først manuelt og deretter mekanisk i 15 min for bedre spredning. Etter sentrifugering ved 9000 × g (Avanti J-e sentrifuge; Beckman-Coulter, Brea, CA, USA) ble bunnen ekstrahert to ganger og supernatantene samlet, filtrert til 0.45 µ og injisert. Metoden ble testet med surt vann (0,01 N H2SO4). Prøvestandarder Ble Brukt Sigma-Aldrich(St. Louis, MO, USA).

fruktfuktighetsinnhold

fruktprøvetaking ble utført som i fruktsukker og syreinnhold ovenfor. Datomasse fra to frukter ble gjenvunnet og malt med flytende nitrogen for å homogenisere prøven og lagret ved -80 °C for å oppnå en enkelt måling per variasjon. Fuktighetsinnholdet ble gravimetralt bestemt ved å måle vekttapet på 2,5 g datomasseprøver, tørket ved 70 °C til prøvene nådde en stabil vekt.

genom-wide association analysis

vi kjørte genom-wide association mapping analysis bruker gapit R package25. For beregningseffektivitet og for å minimere flere testproblemer, men gi tett dekning med hensyn TIL LD-forfallsavstanden, brukte vi et 5.5% downsampled tilfeldig SNP-sett (392,948 SNPs). EN CMLM26 bruker både befolkningsstruktur og slektskap informasjon som kovariater ble utført på genotyper fra 157 dato palm prøver. Populasjonsstruktur ble utledet med en hovedkomponentanalyse (pca) generert Av Gapit ved hjelp av 1% Av Snp-Ene (tilfeldig samplet). Gapit brukte videre DE fem første komponentene I PCA (Fig. 1a; Supplerende Data 2). Slektskap ble utledet ved Hjelp Av VanRaden-algoritmen (Supplerende Data 3). Signifikante Snp-er ble identifisert ved bruk av en konservativ Bonferroni-terskel for P < 1,27 × 10-7. For egenskaper med betydelige resultater, vi videre utført en ANDRE GWAS analyse ved hjelp av full SNP sett på bestemte LGs hvor betydelige SNPs ble identifisert.

Karakterisering Av Ibn Majid og VIR genet

Vi har tidligere identifisert en copia-lignende retrotransposon innsetting polymorfisme i exon 3 av EN r2r3-MYB transkripsjon faktor13 (NCBI Gen ID: LOC103717680) som er ortolog til Virescens (VIR) genet i olje palm28. For å karakterisere denne retrotransposon, VI PCR-forsterket elementet lang terminal gjentar (samt tilstøtende VIR genet sekvens) I Thory og Empress varianter samlet fra USDA gården I Termisk, California og usda/UC Riverside farm henholdsvis Ved Hjelp GoTaq PCR Kjernesystemer (Promega, Madison, WI USA) buffer OG polymerase.primerparene 5 ‘-TGT GTC CGG CAT TGC ACT TCT-3′ (fremover) og 5′-GCT CAA TGT TGA tgt tgt tgt tgg-3′ (bakover) ble brukt for 5′ LTR, og 5′-ACTC TGA CTA CCA AGT ACT TGA tg-3′ (fremover) og 5’-CTG CAC TAT TAT CAC AGT AGA tgg-3 ‘(bakover) for 3 ‘ ltr. Forsterkede produkter ble sendt Til Sanger-sekvensering På GeneWiz (South Plainfield, New Jersey). Vår genom montering inneholder også en komplett kopi av innsetting (~11.7 kb). BLAST ble brukt til å justere innsetting mot seg selv for å identifisere matchende lang terminal gjenta regioner. Programmet LTRdigest71 ble brukt til å bekrefte BLAST resultater. ET BLAST-søk spurte Hele Ibn Majid-sekvensen mot datapalmgenomet for å bestemme kopieringsnummeret.

Supplerende Tabell 11 gir koordinater for vår manuelle annotering AV VIR-genet I BC4 mannlig montering. Genotyping Av Ibn Majid innsetting I VIR exon 3 i daddelpalme varianter ble utført ved manuell inspeksjon av justert leser spenner over innsetting regionen I JBrowse72. SIDEN BC4 mannlige genom montering har innsetting allel (VIRIM, Se Fig. 3), kartlagt leser som stammer fra villtype (VIR+), eller ikke-innsettingsalleler, er mykklippet ved exon 3-innsettingsgrensen. Vi scoret tilstedeværelsen av soft-clipped leser (støtter tilstedeværelsen AV EN VIR+ allel) eller unclipped leser spenner over exon 3-innsetting grensen (støtter tilstedeværelsen AV EN VIRIM innsetting allel) for å identifisere genotyper. Vi gjentok denne prosedyren ved å undersøke lese justeringer på både 5 ‘og 3’ ender av innsetting I BC4 mannlige montering og prøver hvor både 5 ‘og 3’ genotyper gitt matchende genotyper ble beholdt for analyse. Gitt vår interesse for frukt farge fenotyper, vi genotyped kvinnelige palmer bare.

Karakterisering av invertaser og sletting polymorfismer

Undersøkelse av gener i sukker sammensetning QTL PÅ LG 14 (Supplerende Data 6) først avslørt tre posisjons kandidater-en alkalisk / nøytral invertase (chr14G0028200) og to tilstøtende cellevegg invertaser (chr14G0022900 og chr14G0023100) spådd av vår genet merknad rørledning. Vi sjekket for potensielle ekstra uannoterte kopier av invertase i denne regionen ved å samkjøre spådde transkripsjoner for hver av de tre gener til denne regionen ved Hjelp Av Splign transkripsjon til genomisk justering verktøy73. Dette gjenvunnet en minus streng sekvens (som vi refererer TIL SOM CWINV2), med nær homologi til flankerende invertaser CWINV1 OG CWINV3 på 2,489,373 til 2,485,592, men flere innsetting/slettinger i regioner homologe til invertase CDS exons.

Dekningsdybde for sletting variasjonsanalyse ble bestemt i 500 bp ikke-overlappende hyller med samtools bedcov74 (v. 1.9) bruke standardinnstillinger. Rå dybdeverdier ble normalisert uavhengig for hver prøve ved å dele rå dybden av hver bin med median rå dybden av ALLE hyller PÅ LG 14 følgende ved log2 transformasjon følgende Blomster et al.75. Prøver ble genotypet i homozygot sletting og alternative genotype klasser for 40 kb sletting ved manuell inspeksjon Av Supplerende Fig. 12. Homozygote genotyper for sletting oppstrøms FOR A / N-INV1 (Fig. 4, Supplerende Fig. 13) ble kalt ved å sette en terskel som krever at minst en 500 bp intervall i 5 kb sletting regionen har log2 normalisert dybde mindre enn -5. I dag, det er ikke mulig å skille heterozygoter for sletting alleler fra innsetting homozygoter på grunn av moderat dekning i våre re-sekvensering data.

invertase enzymanalyse

To sukrose og to reduserende sukkervarianter ble valgt for invertase-analysen. Forsøket ble utført på to dager med alle fire varianter representert av en enkelt frukt på hver dag. Analyser ble utført på en khalal stadium frukt snap-frosset på tidspunktet for innsamling (se ovenfor) etterfulgt av lagring på -80 °C. Rå ekstrakter ble oppnådd fra frossen dato frukt etter protokollen Hasegawa Og Smolensky33. Hver frossen frukt ble pulverisert med mørtel og pestle( med frø fjernet), og deretter malt i en kjøkkenblender, og 5 g plassert i kald ekstraksjonsbuffer (20 ml 4,0% NaCl, 1 g polyvinylpyrrolidon, PVP). Et ekstra macerasjonstrinn ble utført i en laboratoriehomogenisator i 1-2 min. Ekstraktet ble deretter sentrifugert til 20 000 × g i 15 minutter til 4 °C. supernatanten som inneholdt oppløselig invertase ble lagret på is og resten ble sentrifugert en gang til til 20 000 hryvnias g i 15 minutter til 4 °C. supernatantene ble kombinert og 10 ml dialysert mot kaldt vann til 4° over natten for å fjerne sukker fra ekstraktet. Prøven ble deretter delt, og halvparten av prøven ble kokt ved 100 °C for å måle bakgrunnsaktivitet fra potensielt forurensende sukker fra frukten. Invertaseaktivitet av ukokte og kokte råekstrakter ble deretter målt ved kolorimetrisk analyse på En Synergy H1 mikroplateleser med et koblet enzymanalysesett (Sigma catalog no. MAK118) følger produsentens anvisninger.

Frukt RNA-Seq analyse

To RNA-Seq datasett ble samlet for å løse spørsmål om frukt utvikling og variasjon i frukt egenskaper. RNA-Seq på forskjellige fruktutviklingsstadier ble utført på frukt samlet i 2014 fra replikattrær som ligger på Grunnlag Av United Arab Emirates University, Date Palm Tissue Culture Laboratory I Al-Ain, UAE. For dette eksperimentet ble tre eller fire separate trær Av Khenezi (et utvalg med rød frukt) og Khalas (gul frukt) varianter samplet gjentatte ganger ved 45, 75, 105, 120 og 135 dager etter pollinering og frukt snap-frosset på flytende nitrogen. RNA ble hentet fra en enkelt frukt fra hver tre eller flere trær per variasjon etter standardprotokoller For TruSeq bibliotek forberedelse, og 2 × 101 bp parret-end sekvensering utført På En Illumina HiSeq 2500.et annet eksperiment ble utført på khalal-scenen frukt samlet på al-Shuwaib-gården i 2016. Tre frukter ble samlet fra hver av åtte palmer hver av et annet utvalg valgt basert på at de var i eller nær ekstremer av sukrose og reduserte sukker type fordelinger (dvs.høy og lav sukrose konsentrasjon). Frukt ble behandlet som beskrevet ovenfor og biblioteker konstruert Med Nextera library preparation kit (Illumina) og 2 × 76 bp parret-end sekvensering utført på Et NextSeq (Illumina) instrument.

Differensial uttrykk analyse ble utført ved å trimme rå sekvensering leser Med Trimmomatic45 (v 0.36) med parametere ILLUMINACLIP:〈adapter fasta〉:2:30:10 ETTERFØLGENDE:3 LEDENDE:3 GLIDEVINDU:4:15 MINLEN: 36. Reads ble deretter justert TIL BC4 mannlige referansegenomet med STAR split read aligner47 (v. 2.5.3a) og lese teller generert per gen ved å ta unionen av eksoner med htseq-count76 (v. 0.9.1) satt til å inkludere bare unikt kartlagt leser (dvs. htseq-count alternativer –type = exon — mode = union — nonunique = none). Les count normalisering ble utført Med median-of-ratios metode For DESeq277 (v. 1.8.2). Tester av differensialuttrykk Av Virescens (Pdac_HC_chr4G0137100) mellom røde (Khenezi, n = 3 replikatbiblioteker) og gule (Khalas, n = 3 eller 4 replikatbiblioteker) varianter ble utført separat for hver av fruktutviklingstid på 45, 75, 105, 120 og 135 dager etter pollinering. P-verdier er rapportert For En Walds test av hypotesen om ingen fold-forskjell Mellom Khenezi og Khalas uttrykk i hvert trinn.rna-seq analyse av differensial genuttrykk av invertaser a/N-INV1, CWINV1 og CWINV3 (Pdac_HC_chr14G0028200, Pdac_HC_chr14G0022900, Og Pdac_HC_chr14G0023100, henholdsvis) mellom sukrose (n = 4 varianter) og reduserende sukker typer (n = 4 varianter) ble utført ved å bygge tre biblioteker per variasjon fra rna ekstraheres uavhengig av tre FORSKJELLIGE FRUKTER etterfulgt av sekvensering av hvert bibliotek. Analyse av differensialuttrykk mellom sukrose-type og reduksjonstype varianter ble deretter utført ved å justere leser MED STJERNE( se ovenfor), telle leser med htseq-telle, og generere rå telle matriser I DESeq2. Raw teller per gen ble deretter summert over biblioteker for hver variasjon på grunn av lave lese teller i noen biblioteker. Etterfølgende analyse ble utført ved først å slippe lavt antall gener (gener med <10 leser summert over alle 8 prøver) etterfulgt av Standard DESeq2 (v. 1.22.2) arbeidsflyt med fire biologiske replikater (dvs., dato palm varianter) i hver behandlingsgruppe. Ukorrigerte p-verdier for hypotesen om ingen differensialuttrykk presenteres i hovedteksten for tre kandidatgener.

Rapporteringssammendrag

Ytterligere informasjon om forskningsdesign er tilgjengelig I Nature Research Reporting Summary knyttet til denne artikkelen.