Articles

Genomomfattande association kartläggning av datum palm frukt egenskaper

genomsekvensering av BC4 manliga

vi samplade en backcross manliga date palm ligger vid USA: s Department of Agriculture (USDA)/University of California, Riverside farm i termisk, Kalifornien (USDA anslutning nr. PI 555415, källa RIV 7545 PL). Denna hane producerades av fyra generationer av backcrossing med en barhee-kvinna som den återkommande föräldern som en del av ett avelsprogram vid USDA, USA som avbröts på 1970-talet 10,18. Broschyrer rengjordes och snäppfrystes på flytande kväve före transport till Arizona genomics Institute (University of Arizona, Tucson, AZ) för extraktion av DNA med hög molekylvikt och sekvensering.

genomet hos BC4-hanen sekvenserades med användning av en PacBio RSII-sekvenseringsplattform. DNA med hög molekylvikt för sekvensering extraherades från unga blad som antog protokollet Doyle och Doyle42 med mindre modifieringar. Pacbio library preparation följde 20 kb-protokollet och tre bibliotek (gelvalda vid 20, 25 och 30 kb) byggdes. Åttiofem SMRT-celler sekvenserades på en RSII-sequencer med filmsamlingstid på 6 h.cirka 6,4 miljoner läsningar genererades, totalt 72 Gb data (Genomsnittlig delläsningslängd 11,2 kb, N50 18,5 kb). Ytterligare sekvensering av ett kortinsatsbibliotek (2 100 BP-parat slut) utfördes med en Illumina HiSeq 2500-sequencer.

Genommontering

Vi gjorde en k-Mer-baserad uppskattning av genomstorleken från råa korta lässekvenser av BC4-mangenomet för monteringsändamål (KmerFreq_AR i SOAPdenovo243) med standardinställningar och k-Mer-längd inställd på 17. Observera att en experimentell genomstorleksuppskattning för P. dactylifera också gjordes med flödescytometri (se nedan). PacBio läser sedan monteras med FALCON-Unzip19 (V. falcon-2017.06.28–18.01-py2. 7-ucs2) med en utsädestäckning på 55 Kb och den k-mer-baserade genomstorleksuppskattningen på 774 Mb som ingång. Unzip-modulen kördes med standardinställningar.

den resulterande enheten polerades genom att anpassa råa PacBio-läsningar med koger och pil (del av SMRT-Analyssviten v. 2.3.0) följt av att köra Pilon44 v. 1.18 med Illumina korta lässekvenser från BC4-hanen. Ingångar till Pilon producerades genom att trimma de korta avläsningarna med Trimmomatic45 (V. 0.32) för att ta bort 3′ baser under baskvaliteten på Q30 och läser kortare än 30 nukleotider. Läsningar justerades sedan till pilens utgång med Bowtie246 (v. 2.2.6).

de polerade primära contigerna förankrades till LGs av den befintliga genetiska map21 med ALLMAPS22 för att producera en förankrad haploid församling. Ställningssekvenser för den genetiska kartan erhölls från http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gz. Vid anpassning till den genetiska kartan och efter manuell inspektion av justeringen av de råa läsningarna till församlingen, vi hittade bara en instans av mis-montering: en contig måste delas sedan två contig ändar slogs samman head-to-head.

Genome annotation

vi genererade RNA-Seq-bibliotek från flera khalal-scenfrukter (se nedan), en blandning av manliga och kvinnliga blomknoppar (kallad ”blomma” nedan) och pollen och genomförde 2 100 BP-parad sekvensering på ett Illumina HiSeq 2500-instrument (kompletterande Tabell 7). Ytterligare datumpalm RNA-Seq-data från blad och rot hämtades från Sequence Read Archive (kompletterande Tabell 7). RNA-Seq-läsningar trimmomatic45, i linje med den haploida enheten med STAR47 (v. 2.4.0.1) och genmodeller förutsagda av StringTie48 (v. 1.3.2) som ska användas som utbildning för Augustus49 (v.2.3).

genanteckning utfördes med hjälp av MAKER2 pipeline50 (v. 2.31). Homologibaserade bevis, inkluderade 7097 ESTs (nedladdad från NCBI EST-databasen Den 9 februari 2017), proteinsekvenser från Uniprot51, ett dadelpalmsproteom, ett oljepalmproteom52 och RNA-Seq-härledda modeller ovanifrån. Ab initio prediction utfördes med Augustus (v. 3.0) utbildad enligt beskrivningen i Bowman et al.53 Med genmodeller producerade med StringTie48 (v. 1.3.2), från RNA-Seq-inriktningarna.

den råa MAKER2-anteckningen analyserades, tog bort modeller som innehåller te-domäner och saknade bevis på transkription eller närvaron av en Pfam-domän som beskrivs i Bowman et al.53. Med cirka 1 kg icke-organellär single-end WGS Illumina läser, a de novo (icke monteringsbaserat) upprepningsbibliotek producerades med RepeatExplorer54 och analyserades som i Copetti et al.55. Upprepad anteckning av aggregatet utfördes med RepeatMasker (v. 4.0.6; i nukleotidutrymme) och Blaster56 (del av REPET v 2.5-paketet, i proteinutrymme) och senare försonades i en enda anteckningsfil. Icke-kodande RNA förutspåddes med Infernal57 (v. 1.1.2) med rfam library58 (v. 12.2). Träffar över e-värdetröskeln på 1 kg 10-5 filtrerades bort, liksom resultat med poäng lägre än den familjespecifika samlingsgränsen. När loci på båda strängarna förutspåddes hölls bara träffen med högsta poäng. Överföring rna förutspåddes också med tRNAscan-SE59 (v. 2.0) med standardparametrar.

Genomkvalitetsbedömning

visualiseringar av genomaggregatet producerades med assembly-stats programvara (kompletterande Fig. 1, ). Montering fullständighet utvärderades genom att karakterisera genutrymmet med BUSCO20 med användning av 1440 växtorthologgrupper (v. 3) och genom att anpassa ESTs till diploidenheten med Blat60 (v. 350).

uppskattning av datumpalmens genomstorlek

genomstorleken beräknades med hjälp av ettstegsflödescytometriproceduren som beskrivs i Dole Jacobel et al.61 med små ändringar. Kort sagt, ca 1 cm2 Bladmaterial från två P. dactylifera-prover vid Royal Botanic Gardens, Kew, UK collection inkuberades i 30 s på IS i 1 ml ”general purpose buffer” (GPB)62 kompletterat med 3% PVP-40 för att mjukna bladet. Sedan en liknande mängd Bladmaterial av kalibreringsstandarden Petroselinum crispum (Kvarn.) Krångel (1C-värde = 2201 Mb)63 tillsattes och det kombinerade materialet hackades snabbt (men inte för kraftigt) med ett nytt rakblad. Ytterligare 1 ml av GPB-bufferten tillsattes och sedan filtrerades homogenatet genom ett 30 mm nylonnät (Celltrics 30 mm nät, Sysmex, Goritz, Tyskland) i ett rör, 100 ml propidiumjodid (1 mg/mL) tillsattes och provet inkuberades på IS i 10 minuter. Den relativa fluorescensen av 5000 partiklar registrerades med hjälp av en Partec Cyflow SL3 flödescytometer (Partec GmbH, m Bicgnster, Tyskland) utrustad med en 100 mW grön solid state laser (532 nm, Cobolt Samba, Solna, Sverige). Tre replikat av varje blad bearbetades och utgångshistogrammen analyserades med hjälp av FlowMax-programvaran v. 2.4 (Partec GmbH). 1C-värdet för P. dactylifera (Mbp) beräknades som: (Genomsnittlig toppposition för P. dactylifera/Genomsnittlig toppposition för P. crispum) 2201 MB (=1C-värde för P. crispum)63.

GWAS panel

fenotypning för GWAS genomfördes på datumpalmer som ligger på två gårdar i Förenade Arabemiraten. Gårdarna ligger vid Date Palm Research Center i Hamriyah, Ras Al-Khaimah (n = 46) och i Al-Shuwaib, Al-Ain, Abu Dhabi (n = 111) . Befolkningen består främst av kvinnliga kommersiella sorter (n = 145). Hanar (n = 12) som växte på gårdarna sekvenserades också främst för att kartlägga det könsbestämmande stället.

Khalal stage fruktprover samlades in från våren till hösten 2016 och antingen snäppfryst på flytande kväve för RNA-sekvensering eller uppsamlades som färsk frukt för fotografering, skanning (se nedan) och karakterisering av andra fruktegenskaper. Tamar – scenfrukter från samma träd samlades sommaren 2017 för profilering av socker och organisk syra. Bladprover samlades in för DNA-extraktion och genomsekvensering.genomiskt DNA extraherades från antingen blad eller frukt mesocarp / epicarp vävnad med användning av växt dneasy mini kit (Qiagen, Venlo, Nederländerna). DNA-extraktionskolumner och bibliotek förberedda med Illumina Nextera (San Diego, CA) kit. En 2 100 BP-parad sekvensering utfördes på en Illumina HiSeq 2500 sequencer med upp till åtta bibliotek per körfält. Läsningar demultiplexerades och de som passerade Illumina kvalitetskontrollfilter bearbetades med Trimmomatic45 (V. 0.36) för att avlägsna förorenande adaptersekvenser. För borttagning av adapter använde vi adapter och NextEra transposase sequence-databasen som medföljer trimmomatic (V. 0.32) nedladdning med följande inställning ILLUMINACLIP: Jacobi adapter library:2:30:10 MINLEN:76 för att behålla endast läspar där båda läser var 76 bps eller längre efter trimning.

läsningar anpassades till den omaskerade BC4-hanenheten (endast primära contigs) med bwa mem (v. 0.7.15-r1140 ). BWA mem aligner kördes med-M-alternativet för att markera kompletterande läsningar (0 800 bitvis flagga) som sekundära (0 100 100). Provjusteringar bearbetades med FixMateInformation (Picard-tools v.2.8.2; http://broadinstitute.github.io/picard) för att säkerställa konsistens i parad läsinformation, SamSort (Picard-tools v. 2.8.2) för att samordna-Sortera inriktningarna, MarkDuplicates (Picard-tools v. 2.8.2) för att flagga dubbla läspar och med GATK64 Outplånerrealignertargetcreator/Outplånrealigner tool (gatk V. 3.7-0) för att justera läser i Indel regioner. Provjusteringar validerades vid varje steg med ValidateSam (Picard-tools v. 2.8.2) för att säkerställa inga fel i produktionen. Bearbetade inriktningar sammanfattades med CollectAlignmentSummaryMetrics (Picard-tools v. 2.8.2) och Samtools .

SNP-anrop och genotypning

SNP-anrop och genotypning utfördes med GATK (v. 3.7-0) haplotypecaller kör i gvcf-läge följt av gemensam genotypning med GenotypeGVCFs . Läsningar filtrerades från haplotypecaller-steget för att utesluta de med en kartläggningskvalitet mindre än 20 och att utesluta de markerade som polymeraskedjereaktion (PCR) dubbletter eller sekundära anpassningar (se ovan). Detta tillvägagångssätt gav 32,384,028 SNP över alla prover. SNP-filtrering utfördes genom att applicera hårda filter på de råa varianterna med GATK v. 4.0.2.1. Vi filtrerade raw-anropsuppsättningen för att utesluta SNP: er med låg (<785) och högt djup (>2862) summerade över prover. Vi utesluter också multi-alleliska SNP: er, SNP: er inom 10 bp av indel-polymorfismer och SNP: er som uppfyller följande villkor: QUAL < 30 och QD < 5.0. Genotyper ställdes in som saknade om DP var under 5 eller över 20, såväl som SNP med en genotyp samtalsfrekvens < 80%, eller en mindre allelfrekvens under 0,01. Vi uppskattade ett P-värde för varje plats från ett Hardy-Weinberg Jämviktstest med vcftools65 och filtrerade ut SNP som visar ett överskott i heterozygositet (exakt test, P < 0.05). Denna procedur gav en filtrerad samtalsuppsättning på 7 149 205 SNP.

statistisk analys

all statistisk analys utfördes på R statistical computing-språket om inte annat anges.

ld-analys

LD uppskattades med hjälp av en metod för uppskattning av r2 som är lämplig för ofasade data (se VCFtools65). Ld-sönderfallskurvan för GWAS-panelen beräknades som i Blommor et al.4. I korthet beräknades r2 för icke fasade SNP: er med mindre allelfrekvens större än 10% med alternativet–geno-ld i VCFtools (v. 0.1.14). Förfallskurvor genererades genom att passa en kurva till parvis R2 uppskattningar av fysiskt avstånd mellan SNP par med olinjära minsta kvadrater med användning av ett tillvägagångssätt anpassat från Marroni et al.66. Halvförfallsavståndet beräknades sedan som Avståndet vid vilket r2 är hälften av dess maximala värde (dvs 1 bp-avstånd).

karakterisering av fruktfärg

åtta khalal-scenfrukter utan skada per dadelpalmsort skördades, sköljdes med kranvatten för att avlägsna damm och lufttorkades sedan. Frukten skivades i längdriktningen och fruktfärgen mättes sedan med två strategier. Först fotograferade vi de skivade frukterna med en färgkontroll i en kamerafotostudiobox, där bilderna togs på en vit bakgrund med en digitalkamera. Fruktens färg analyserades med ImageJ software67 med hjälp av RGB-färgparametrarna.

För det andra använde vi ett kompletterande tillvägagångssätt där vi använde tomatanalysatorprogramvara 68 v. 2.2 för att få uppskattningar av färgparametrar L*, A*, b*. L * – koordinaten uttrycker färgens mörker och ljushet och sträcker sig från svart (0) till vitt (100). Koordinater A* och B * express färgriktning, där + A* är i röd riktning, −a* i grön riktning, +b* I gul riktning och −b * I blå riktning68. Bildförvärv och analys gjordes enligt beskrivningen i Rodr Bisexguez et al.27. Skivad frukt placerades på en skanner med svart bakgrund och täcktes för att undvika effekterna av omgivande ljus. Skannade bilder sparades som JPEG-filer och uppskattningarna av färgparametrarna L*, A*, b* gjordes på varje frukt. Medelvärdet av all frukt beräknades. De två metoderna var starkt korrelerade, så vi använde färgindex a*/b* för att utvärdera skillnaderna i hudfärger på frukterna och använde det för föreningsstudien.

Fruktanthocyanininnehåll

totalt antocyanin extraherades från tre replikater av khalal-scenfrukt från varje dadelpalmsort med frukt som snap-fryst på flytande kväve enligt proceduren som beskrivs i Rabino och Mancinelli69 med mindre modifiering. Kort sagt maldes antocyanin från fryst frukthud (100 mg) till fint pulver och extraherades i 1 ml sur metanol (1% HCl) genom inkubation vid rumstemperatur i mörkret i 18 timmar, följt av centrifugering i 10 minuter vid 12 000 g. Kvantifiering av totalt antocyanin gjordes med användning av absorbansen mätt med en spektrofotometer med hjälp av ekvationen

totalt antocyanin = (A530 – 0,25 ml A657)/FW, där A530 och a657 nm är absorbansen och FW är växtmaterialets våta Vikt (g).

fruktstorlek

fruktfotografier som används för färganalys (se ovan) inkluderade en linjal som storleksstandard. ImageJ67 (V. 2) och tomat analyzer software27 användes sedan för att uppskatta fruktlängd och bredd.

fruktsocker och syrahalt

frukt sackaros, glukos och fruktos kvantifierades från 125 sorter vid tamarstadiet när frukterna är torra, mogningen är klar och det stadium vid vilket datum vanligtvis konsumeras. Frukt var snäppfryst vid -20 C och mellan 10 och 15 frukter per sort bibehölls omedelbart vid -20 C genom ankomst till Montpellier (French Agricultural Research Center for International Development, CIRAD) där högpresterande vätskekromatografianalys utfördes. En enda mätning från två poolade frukter erhölls för var och en av socker-och syraegenskaperna. Datum bitar (utan sten) frystes med flytande kväve och maldes i pulver, sätta i två separata täta glasflaskor, lagras vid -20 c c tills provtagning. För torrsubstansen, i duplikat, vägdes 1 g prov och placerades i en spis under vakuum vid 70 C i 72 h. en kontroll kontrollerades i 4 dagar för att bestämma den optimala varaktigheten. Socker extraktioner utfördes med användning av metoden anpassad från Bchir et al.70. För varje prov placerades 500 mg datumpasta och 10 ml 80% etanol i ett 15 ml rör, upphettades i 5 minuter vid 80 kg C i ett vattenbad. Varje rör omrördes sedan först manuellt och sedan mekaniskt i 15 min för bättre spridning. Efter centrifugering vid 9000 CGR (Avanti j-e centrifug; Beckman-Coulter, Brea, CA, USA) extraherades botten två gånger och supernatanterna samlades, filtrerades vid 0,45 CGR och injicerades. Metoden testades med surt vatten (0,01 N H2SO4). Provstandarder var Sigma-Aldrich (St.Louis, MO, USA) användes.

fruktfuktinnehåll

fruktprovtagning utfördes som i avsnittet fruktsocker och syrainnehåll ovan. Datummassa från två frukter återvanns och maldes med flytande kväve för att homogenisera provet och lagrades vid -80 kg C för att erhålla en enda mätning per sort. Fukthalten bestämdes gravimetriskt genom att mäta viktminskningen på 2,5 g datummassaprover, torkade vid 70 CCG tills proverna nådde en stabil vikt.

genomomfattande associationsanalys

vi körde den genomomfattande associeringsmappningsanalysen med Gapit R-paketet25. För beräkningseffektivitet och för att minimera problem med flera tester men ge tät täckning med avseende på ld-sönderfallsavståndet använde vi en 5.5% nedsamplad slumpmässig SNP-uppsättning (392,948 SNP). En CMLM26 med både befolkningsstruktur och släktskapsinformation som kovariater utfördes på genotyperna från 157 dadelpalmprover. Befolkningsstrukturen härleddes med en huvudkomponentanalys (PCA) genererad av Gapit med 1% av SNP: erna (slumpmässigt samplade). Gapit använde vidare de första fem komponenterna i PCA (Fig. 1a; kompletterande uppgifter 2). Släktskap härleddes med hjälp av vanraden-algoritmen (kompletterande Data 3). Signifikanta SNP: er identifierades med användning av en konservativ Bonferroni-tröskel för P < 1,27 kub 10-7. För egenskaper med signifikanta resultat utförde vi ytterligare en andra GWAS-analys med hela SNP-uppsättningen på specifika LGs där betydande SNP identifierades.

karakterisering av Ibn Majid och vir-genen

vi identifierade tidigare en copia-liknande retrotransposoninsättningspolymorfism i exon 3 av en r2r3-MYB-transkriptionsfaktor13 (NCBI-Gen-ID: LOC103717680) som är ortolog mot Virescens (VIR) – genen i oljepalm28. För att karakterisera denna retrotransposon förstärkte vi PCR-elementet långa terminalupprepningar (såväl som intilliggande vir-gensekvens) i Thory-och Empress-sorter samlade från USDA-gården i termisk, Kalifornien respektive USDA/UC Riverside farm, Med GoTaq PCR-kärnsystem (Promega, Madison, WI USA) buffert och polymeras.

primerparen 5′-TGT GTC CGG CAT TGC ACT TCT-3′ (framåt) och 5′-GCT CAA TGT TGA TGT TGT tgt TGG-3′ (omvänd) användes för 5′ LTR och 5′-ACTC TGA CTA CCA AGT ACT TGA tg-3′ (framåt) och 5′-CTG CAC TAT tat CAC AGT AGA TGG-3′ (omvänd) för 3′ ltr. Förstärkta produkter skickades för Sanger-sekvensering vid GeneWiz (South Plainfield, New Jersey). Vår genommontering innehåller också en fullständig kopia av insättningen (~11,7 kb). BLAST användes för att anpassa insättningen mot sig själv för att identifiera matchande långa terminalrepetitionsregioner. Programmet LTRdigest71 användes för att bekräfta BLAST-resultaten. En SPRÄNGSÖKNING frågade hela Ibn Majid-sekvensen mot datumpalmgenomet för att bestämma kopieringsnummer.

kompletterande Tabell 11 ger Koordinater för vår manuella anteckning av Vir-genen i BC4-hanenheten. Genotypning av Ibn Majid-insättningen i VIR exon 3 i dadelpalmsorter utfördes genom manuell inspektion av inriktade läsningar som spänner över insättningsområdet i JBrowse72. Eftersom BC4-manliga genomenheten har införingsallelen (VIRIM, se Fig. 3), mappade läsningar som härrör från vild typ (VIR+) eller alleler som inte är införda, är mjuka klippta vid exon 3-införingsgränsen. Vi gjorde närvaron av mjukklippta läsningar (stöder närvaron av en vir+ allel) eller oklippta läsningar som spänner över exon 3-införingsgränsen (stöder närvaron av en virim-införingsallel) för att identifiera genotyper. Vi upprepade denna procedur genom att undersöka läsjusteringar vid både 5′ och 3′ ändarna av införandet i BC4-hanenheten och prover där både 5′ och 3 ’ genotyper gav matchande genotyper behölls för analys. Med tanke på vårt intresse för fruktfärgfenotyper, genotypade vi bara kvinnliga palmer.

karakterisering av invertaser och deletionspolymorfismer

undersökning av gener i sockerkompositionen QTL på LG 14 (kompletterande Data 6) avslöjade initialt tre positionskandidater—ett alkaliskt/neutralt invertas (chr14G0028200) och två intilliggande cellvägginvertaser (chr14G0022900 och chr14G0023100) förutsagt av vår genanteckningsrörledning. Vi kontrollerade för potentiella ytterligare oannoterade kopior av invertas i denna region genom att anpassa förutspådda transkript för var och en av de tre generna till denna region med hjälp av Splign-transkriptet till genomic alignment tool73. Detta återhämtade en minussträngsekvens (som vi hänvisar till som CWINV2), med nära homologi till de flankerande invertaserna CWINV1 och CWINV3 vid 2,489,373 till 2,485,592, men flera Infogningar/borttagningar i regioner som är homologa med invertase CDS exons.

Täckningsdjup för deletion variationsanalys bestämdes i 500 bp icke-överlappande fack med samtools bedcov74 (v. 1.9) använda standardinställningarna. Rådjupvärden normaliserades oberoende för varje prov genom att dividera rådjupet för varje bin med medianrådjupet för alla lagerplatser på LG 14 efter log2-transformation efter blommor et al.75. Prover genotypades till homozygot deletion och alternativa genotyp klasser för 40 kb deletion genom manuell inspektion av kompletterande Fig. 12. Homozygota genotyper för radering uppströms A / N-INV1 (Fig. 4, Kompletterande Fig. 13) kallades genom att ställa in ett tröskelvärde som kräver att minst ett 500 bp-intervall i 5 kb-borttagningsområdet har log2 normaliserat djup mindre än -5. För närvarande är det inte möjligt att skilja heterozygoter för raderingsalleler från införingshomozygoter på grund av den måttliga täckningen i våra re-sekvenseringsdata.

Invertasenzymanalys

två sackaros-och två reducerande sockervarianter valdes för invertasanalysen. Experimentet genomfördes på två dagar med alla fyra sorter representerade av en enda frukt varje dag. Analyser utfördes på ett khalal-Stadium frukt snapfryst vid insamlingstillfället (se ovan) följt av lagring vid -80 C. råa extrakt erhölls från den frysta datumfrukten enligt protokollet Hasegawa och Smolensky33. Varje frusen frukt pulveriserades med mortel och mortelstöt (med frö avlägsnat) och maldes sedan i en köksblandare och 5 g placerades i kall extraktionsbuffert (20 ml 4,0% NaCl, 1 g polyvinylpyrrolidon, PVP). Ett ytterligare macerationssteg utfördes i en laboratoriehomogenisator i 1-2 min. Extraktet centrifugerades sedan vid 20 000 g g i 15 min vid 4 CGR C. supernatanten innehållande lösligt invertas lagrades på is och resten centrifugerades en andra gång vid 20 000 g g i 15 min vid 4 CGR C. supernatanterna kombinerades och 10 ml dialyserades mot kallt vatten vid 4 CGR över natten för att avlägsna socker från extraktet. Provet delades sedan upp och hälften av provet kokades vid 100 kg C för att mäta bakgrundsaktivitet från potentiellt förorenande socker från frukten. Invertasaktivitet av okokta och kokta råa extrakt mättes sedan med kolorimetrisk analys på en Synergy H1-mikroplatläsare med ett kopplat enzymanalyssats (Sigma catalog no. MAK118) enligt tillverkarens instruktioner.

frukt RNA – Seq analys

två RNA-Seq dataset samlades in för att ta itu med frågor om fruktutveckling och variation i fruktegenskaper. RNA-Seq vid olika fruktutvecklingsstadier genomfördes på frukter som samlades in 2014 från replikaträd som ligger på grund av Förenade Arabemiraten University, Date Palm Tissue Culture Laboratory i Al-Ain, UAE. För detta experiment provades tre eller fyra separata träd av khenezi (en sort med röd frukt) och Khalas (gul frukt) sorter upprepade gånger vid 45, 75, 105, 120 och 135 dagar efter pollinering och frukt snap-fryst på flytande kväve. RNA extraherades från en enda frukt från varje tre eller flera träd per sort enligt standardprotokoll för TruSeq-biblioteksberedning, och 2 101 BP-parad sekvensering utförd på en Illumina HiSeq 2500.

ett andra experiment genomfördes på khalal-scenfrukt som samlades på Al-Shuwaib-gården 2016. Tre frukter samlades in från var och en av åtta Palmer var och en av en annan sort som valts utifrån att de var vid eller nära ytterligheterna av sackaros och minskade fördelningar av sockertyp (dvs. hög och låg sackaroskoncentration). Frukter bearbetades som beskrivits ovan och bibliotek konstruerade med NextEra library preparation kit (Illumina) och 2 76 BP-parad sekvensering utförd på ett NextSeq-instrument (Illumina).

Differential expressionsanalys utfördes genom trimning rå sekvensering läser med Trimmomatic45 (v 0.36) med parametrar ILLUMINACLIP: Jacobs adapter fasta:2:30:10 avslutande:3 Ledande:3 SLIDINGWINDOW:4:15 MINLEN:36. Läsningar anpassades sedan till BC4 – manliga referensgenomet med STAR split read aligner47 (v. 2.5.3a) och läsantal genererade per gen genom att ta föreningen av exoner med htseq-count76 (V. 0.9.1) inställd på att endast inkludera unikt mappade läsningar (dvs htseq-count-alternativ –type = exon–mode = union–nonunique = none). Normalisering av läsantal utfördes med median-of-ratio-metoden för DESeq277 (v. 1.8.2). Tester av differentiellt uttryck av Virescens (Pdac_HC_chr4G0137100) mellan röda (Khenezi, n = 3 replikatbibliotek) och gula (Khalas, n = 3 eller 4 replikatbibliotek) sorter genomfördes separat för var och en av fruktutvecklingstiderna på 45, 75, 105, 120 och 135 dagar efter pollinering. P-värden rapporteras för ett Walds test av hypotesen om ingen vikskillnad mellan Khenezi och Khalas uttryck i varje steg.

RNA-seq-analys av differentialgenuttryck av invertaser a/N-INV1, CWINV1 och CWINV3 (Pdac_HC_chr14G0028200, Pdac_HC_chr14G0022900 respektive Pdac_HC_chr14G0023100) mellan sackaros (n = 4 sorter) och reducerande sockertyper (n = 4 sorter) genomfördes genom att bygga tre bibliotek per sort från rna extraheras oberoende av tre olika frukter följt av sekvensering av varje bibliotek. Analys av differentiellt uttryck mellan sackaros-typ och reducerande typ sorter utfördes sedan genom att anpassa läsningar med stjärna (se ovan), räkna läsningar med htseq-count och generera råräkningsmatriser i DESeq2. Råa räkningar per gen summerades sedan över bibliotek för varje sort på grund av låga läsantal i vissa bibliotek. Efterföljande analys utfördes genom att först släppa lågräkningsgener (gener med <10 läser sammanfattad över alla 8 prover) följt av standard deseq2 (V. 1.22.2) arbetsflöde med fyra biologiska replikat (dvs., dadelpalmsorter) i varje behandlingsgrupp. Okorrigerade p-värden för hypotesen om inget differentiellt uttryck presenteras i huvudtexten för tre kandidatgener.

Rapporteringsöversikt

Mer information om forskningsdesign finns i sammanfattningen Nature Research Reporting som är kopplad till denna artikel.