Articles

maparea asocierii la nivel de genom a trăsăturilor de fructe de palmier

secvențierea genomului masculului BC4

am prelevat o palmă de date masculină backcross situată la Departamentul Agriculturii din Statele Unite (USDA)/Universitatea din California, ferma Riverside din Thermal, California (USDA accession No. PI 555415, Sursa RIV 7545 PL). Acest mascul a fost produs de patru generații de backcrossing cu o femelă Barhee ca părinte recurent ca parte a unui program de reproducere la USDA, SUA,care a fost întrerupt în anii 197010, 18. Pliantele au fost curățate și înghețate pe azot lichid înainte de a fi transportate la Institutul de Genomică din Arizona (Universitatea din Arizona, Tucson, AZ) pentru extragerea ADN-ului cu greutate moleculară mare și secvențierea.

genomul masculului BC4 a fost secvențiat folosind o platformă de secvențiere PACBIO RSII. ADN-ul cu greutate moleculară mare pentru secvențiere a fost extras din frunzele tinere adoptând protocolul Doyle și Doyle42 cu modificări minore. Pregătirea bibliotecii PacBio a urmat protocolul de 20 kb și au fost construite trei biblioteci (selectate cu gel la 20, 25 și 30 kb). Optzeci și cinci de celule SMRT au fost secvențiate pe un secvențiator RSII cu timp de colectare a filmelor de 6 ore. au fost generate aproximativ 6,4 milioane de citiri, totalizând 72 Gb de date (lungimea medie a subread-ului 11,2 kb, N50 18,5 kb). Secvențierea suplimentară a unei biblioteci de inserturi scurte (2 x,100 bp pereche) a fost efectuată cu un secvențiator Illumina HiSeq 2500.

Adunarea genomului

am făcut o estimare bazată pe k-mer a dimensiunii genomului din secvențe brute de citire scurtă ale genomului masculin BC4 în scopuri de asamblare (KmerFreq_AR în SOAPdenovo243) cu setările implicite și lungimea k-mer setată la 17. Rețineți că o estimare experimentală a dimensiunii genomului pentru P. dactylifera a fost făcută și folosind citometria în flux (vezi mai jos). Citirile PacBio au fost apoi asamblate cu FALCON-Unzip19 (v. falcon-2017.06.28–18.01-py2.7-ucs2), cu o acoperire a semințelor de 55 inkt și estimarea dimensiunii genomului bazată pe k-mer de 774 Mb ca intrare. Modulul de dezarhivare a fost rulat cu setările implicite.

ansamblul rezultat a fost lustruit prin alinierea Raw pacbio citește cu tolba și săgeată (parte a suitei de analiză SMRT v. 2.3.0), urmată de rularea Pilon44 v. 1.18 cu Illumina secvențe scurte de citire de la mascul BC4. Intrările la Pilon au fost produse prin tăierea citirilor scurte cu Trimmomatic45 (v.0.32) pentru a elimina bazele de 3′ sub calitatea de bază a Q30 și citirile mai scurte de 30 de nucleotide. Citirile au fost apoi aliniate la ieșirea Arrow cu Bowtie246 (v.2.2.6).

contigurile primare lustruite au fost ancorate la LGs ale hărții genetice existente21 cu ALLMAPS22 pentru a produce un ansamblu haploid ancorat. Secvențele de schele pentru harta genetică au fost obținute de la http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gz. La alinierea la harta genetică și după inspecția manuală a realinierii citirilor brute la ansamblu, am găsit o singură instanță de asamblare greșită: un contig a trebuit împărțit, deoarece două capete contig au fost îmbinate cap la cap.

adnotarea genomului

am generat biblioteci ARN-Seq din mai multe fructe în stadiu khalal (vezi mai jos), un amestec de muguri de flori masculi și femele (denumit mai jos „floare”) și polen și am efectuat secvențierea 2 la 100 BP în pereche pe un instrument Illumina HiSeq 2500 (tabelul suplimentar 7). Date suplimentare ARN de palmier-Seq din frunze și rădăcină au fost descărcate din arhiva de citire a secvenței (tabelul suplimentar 7). Citirile ARN-Seq au fost tăiate cu Trimmomatic45, aliniate la ansamblul haploid cu STAR47 (V.2.4.0.1) și modele de gene prezise de StringTie48 (v. 1.3.2) a se utiliza ca pregătire pentru Augustus49 (V.2.3).

adnotarea genei a fost efectuată cu ajutorul conductei MAKER250 (v. 2.31). Dovezi bazate pe omologie, au inclus 7097 ESTs (descărcate din Baza de date NCBI EST pe 9 februarie 2017), secvențe de proteine de la Uniprot51, un proteom de palmier dat, un proteom de palmier de ulei 52 și modelele derivate din ARN-Seq de mai sus. Predicția Ab initio a fost efectuată cu Augustus (v.3.0) instruit așa cum este descris în Bowman și colab.53 cu modele de gene produse cu StringTie48 (v. 1.3.2), din aliniamentele ARN-Seq.

adnotarea RAW MAKER2 a fost analizată, eliminând modelele care conțin domenii TE și lipsite de dovezi de transcriere sau prezența unui domeniu Pfam așa cum este descris în Bowman și colab.53. Cu aproximativ 1 hectar de WGS non-organellar cu un singur capăt Illumina citește, o bibliotecă de repetare de novo (fără asamblare) a fost produsă cu RepeatExplorer54 și analizată ca în Copetti și colab.55. Repetarea adnotării ansamblului a fost efectuată cu RepeatMasker (v.4.0.6; în spațiul nucleotidic) și Blaster56 (parte a pachetului REPET v 2.5, în spațiul proteic) și ulterior reconciliată într-un singur fișier de adnotare. ARN-urile necodificate au fost prezise cu Infernal57 (v. 1.1.2) cu Biblioteca Rfam58 (v. 12.2). Au fost filtrate accesările peste pragul de valoare e de 1,10-5 la sută, precum și rezultatele cu un scor mai mic decât pragul de colectare specific familiei. Când s-au prezis loci pe ambele componente, s-a păstrat doar lovitura cu cel mai mare scor. ARN-urile de Transfer au fost, de asemenea, prezise folosind tRNAscan-se59 (v. 2.0) cu parametrii impliciți.

Evaluarea calității genomului

vizualizările ansamblului genomului au fost realizate cu ajutorul software-ului assembly-stats (Fig suplimentar. 1, ). Completitudinea ansamblului a fost evaluată prin caracterizarea spațiului genic cu BUSCO20 folosind 1440 grupuri ortologice vegetale (v. 3) și prin alinierea est la ansamblul diploid cu Blat60 (v. 350).

data estimării dimensiunii genomului palmei

dimensiunea genomului a fost estimată utilizând procedura de citometrie în flux într-o singură etapă descrisă în Dole Oximel și colab.61 cu mici modificări. Pe scurt, aproximativ 1 cm2 de material de frunze de la două P. probele dactylifera de la Royal Botanic Gardens, Kew, Marea Britanie au fost incubate timp de 30 s pe gheață în 1 ml de „tampon de uz general” (GPB)62 suplimentat cu 3% PVP-40 pentru a înmuia frunza. Apoi, o cantitate similară de material de frunze a standardului de calibrare Petroselinum crispum (Mill.)S-a adăugat tam-tam (valoare 1C = 2201 Mb) 63 și materialul combinat a fost tocat rapid (dar nu prea puternic) folosind o nouă lamă de ras. S-au adăugat încă 1 ml de tampon GPB și apoi omogenatul a fost filtrat printr-o plasă de nylon de 30 mm (celltrics 30 mm mesh, Sysmex, Goritz, Germania) într-un tub, s-au adăugat 100 de iodură de propidiu de un litru de apă (1 mg/mL), iar proba a fost incubată la gheață timp de 10 min. Fluorescența relativă a 5000 de particule a fost înregistrată cu ajutorul unui Citometru de flux Partec Cyflow SL3 (Partec GmbH, m Inktictster, Germania) echipat cu un laser solid verde de 100 mW (532 nm, Cobolt Samba, Solna, Suedia). Au fost procesate trei replici ale fiecărei frunze, iar histogramele de ieșire au fost analizate folosind software-ul FlowMax v. 2.4 (Partec GmbH). Valoarea 1C a P. dactylifera (Mbp) a fost calculată astfel: (poziția medie de vârf A P. dactylifera/poziția medie de vârf A P. crispum) 2201 Mb (=valoarea 1C a P. crispum)63.

panoul GWAS

fenotiparea pentru GWAS a fost efectuată pe palmieri de date localizați în două ferme din Emiratele Arabe Unite. Fermele sunt situate la data Palm Research Center din Hamriyah, Ras Al-Khaimah (n = 46) și în Al-Shuwaib, Al-Ain, Abu Dhabi (N = 111) . Populația este formată în principal din soiuri comerciale feminine (n = 145). Masculii (n = 12) care cresc în ferme au fost, de asemenea, secvențiați în primul rând în scopul cartografierii locusului care determină sexul.probele de fructe din stadiul Khalal au fost colectate din primăvară până în toamnă în 2016 și fie înghețate pe azot lichid pentru secvențierea ARN, fie colectate ca fructe proaspete pentru fotografie, scanare (vezi mai jos) și caracterizarea altor trăsături de fructe. Fructele Tamar stage din aceiași copaci au fost colectate în vara anului 2017 pentru profilarea zahărului și a acidului organic. Probele de frunze au fost colectate pentru extracția ADN-ului și secvențierea genomului.ADN-ul Genomic a fost extras fie din țesutul mezocarp/epicarp din frunze, fie din fructe folosind mini kit-ul dneasy din plante (Qiagen, Venlo, Olanda). Coloane de extracție ADN, și biblioteci preparate folosind Illumina Nextera (San Diego, CA) kit. O secvențiere cu capăt pereche de 2 centimetri 100 bp a fost efectuată pe un secvențiator Illumina HiSeq 2500 cu până la opt biblioteci pe bandă. Citirile au fost demultiplexate, iar filtrele de control al calității Illumina care treceau au fost procesate cu Trimmomatic45 (v.0.36) pentru a elimina secvențele adaptorului contaminant. Pentru îndepărtarea adaptorului, am folosit adaptorul și baza de date Nextera transposase sequence inclusă în descărcarea Trimmomatic (v.0.32) cu următoarea setare ILLUMINACLIP: biblioteca adaptorului Irak:2:30:10 MINLEN:76 pentru a reține numai perechile de citire în care ambele citiri au fost de 76 bps sau mai mult după tăiere.

citirile au fost aliniate la ansamblul masculin BC4 demascat (numai contigii primari) folosind bwa mem (v.0.7.15-r1140). Aliniatorul bwa mem a fost rulat cu opțiunea-M pentru a marca citirile suplimentare (0 pavilion 800 la nivel de biți) ca secundar (0 100 la sută). Alinierile eșantioanelor au fost procesate cu FixMateInformation (Picard-tools V.2.8.2; http://broadinstitute.github.io/picard) pentru a asigura coerența informațiilor citite în pereche, SamSort (Picard-tools V. 2.8.2) pentru a coordona-sorta aliniamentele, MarkDuplicates (Picard-tools V. 2.8.2) pentru a semnala perechi de citire duplicate și cu GATK64 IndelRealignerTargetCreator/IndelRealigner tool (gatk V. 3.7-0) pentru a realinia citește în regiunile Indel. Alinierile eșantioanelor au fost validate la fiecare etapă folosind ValidateSam (Picard-tools v. 2.8.2) pentru a se asigura că nu există erori în producție. Aliniamentele procesate au fost rezumate cu CollectAlignmentSummaryMetrics (Picard-tools V .2.8.2) și Samtools.

SNP de asteptare si genotipare

SNP-asteptare si genotipare a fost efectuat cu GATK (V .3.7-0) haplotypecaller rula în modul GVCF urmată de comun-genotipare cu GenotypeGVCFs. Citirile au fost filtrate din etapa HaplotypeCaller pentru a exclude cele cu o calitate de cartografiere mai mică de 20 și pentru a exclude cele marcate ca duplicate de reacție în lanț a polimerazei (PCR) sau alinieri secundare (vezi mai sus). Această abordare a dat 32.384.028 SNP-uri în toate probele. Filtrarea SNP a fost realizată prin aplicarea filtrelor dure la variantele brute folosind GATK v. 4.0.2.1. Am filtrat apelul raw setat pentru a exclude SNP-urile cu un nivel scăzut (<785) și o adâncime mare (>2862) însumat pe eșantioane. De asemenea, am exclus SNP-urile multi-alelice, SNP-urile la 10 bp de polimorfismele indel și SNP-urile care îndeplinesc următoarele condiții: QUAL < 30 și QD < 5.0. Genotipurile au fost setate ca lipsă dacă DP era sub 5 sau peste 20, precum și SNP-urile cu o rată de apel a genotipului < 80% sau o frecvență minoră a alelei sub 0,01. Am estimat o valoare P pentru fiecare sit dintr–un test de echilibru Hardy-Weinberg folosind VCFtools65 și am filtrat SNP-urile care arată un exces de heterozigozitate (test exact, p < 0,05). Această procedură a dat un set de apeluri filtrate de 7.149.205 SNPs.

analiza statistică

toate analizele statistice au fost efectuate în limbajul de calcul statistic R, cu excepția cazului în care se indică altfel.

analiza LD

LD a fost estimată utilizând o metodă de estimare a r2 care este adecvată pentru datele nefazate (a se vedea VCFtools65). Curba de dezintegrare LD pentru panoul GWAS a fost calculată ca în Flowers și colab.4. Pe scurt, r2 a fost calculat pentru SNP–uri nefazate cu frecvență alelă minoră mai mare de 10% folosind opțiunea-geno-ld în VCFtools (v. 0.1.14). Curbele de dezintegrare au fost generate prin montarea unei curbe la estimările R2 în perechi prin distanța fizică dintre perechile SNP cu cele mai mici pătrate neliniare folosind o abordare adaptată de la Marroni și colab.66. Distanța de jumătate de decădere a fost apoi calculată ca distanța la care r2 este jumătate din valoarea sa maximă (adică distanța de 1 bp).

caracterizarea culorii fructelor

au fost recoltate opt fructe khalal stage fără leziuni pe soi de palmier, clătite cu apă de la robinet pentru a îndepărta praful și apoi uscate la aer. Fructele au fost feliate longitudinal, iar culoarea fructelor a fost apoi măsurată folosind două strategii. În primul rând, am fotografiat fructele feliate cu un checker de culoare într-o cutie de studio foto, unde fotografiile au fost făcute pe un fundal alb cu o cameră digitală. Culoarea fructului a fost analizată cu software-ul Imagej67 folosind parametrii de culoare RGB.

În al doilea rând, am folosit o abordare complementară, unde am folosit Tomato Analyzer software68 v. 2.2 pentru a obține estimări ale parametrilor de culoare L*, A*, b*. Coordonata L * exprimă întunericul și ușurința culorii și variază de la negru (0) la alb (100). Coordonatele a* și B * exprimă direcția culorii, unde + a * este în direcția roșie − – a* în direcția verde, +b* în direcția galbenă și −b * în direcția albastră68. Achiziția și analiza imaginii a fost făcută așa cum este descris în Rodrigquxguez și colab.27. Fructele feliate au fost plasate pe un scaner cu fundal negru și acoperite pentru a evita efectele luminii ambientale. Imaginile scanate au fost salvate ca fișiere JPEG și estimările parametrilor de culoare L*, A*, b * s-au făcut pe fiecare fruct. A fost calculată media tuturor fructelor. Cele două metode au fost foarte corelate, așa că am folosit indexul de culoare a*/b* pentru a evalua diferențele de culoare a pielii fructelor și l-am folosit pentru studiul de asociere.

conținutul de antocianină din fructe

antocianina totală a fost extrasă din trei replici de fructe din stadiul khalal din fiecare soi de palmier curmal, folosind fructe congelate cu azot lichid în urma procedurii descrise în Rabino și Mancinelli69 cu modificări minore. Pe scurt, antocianina din pielea fructelor congelate (100 mg) a fost măcinată în pulbere fină și extrasă în 1 ml de metanol acid (1% HCl) prin incubare la temperatura camerei în întuneric timp de 18 ore, urmată de centrifugare timp de 10 min la 12.000 g. Cuantificarea antocianinei totale s-a făcut cu ajutorul absorbanței măsurate de un spectrofotometru folosind ecuația

antocianina totală = (A530-0,25 A657)/FW, unde A530 și a657 nm sunt absorbanța și FW este greutatea umedă a materialului vegetal (g).

dimensiunea fructelor

fotografiile cu fructe utilizate pentru analiza culorilor (a se vedea mai sus) au inclus o riglă ca standard de dimensiune. ImageJ67 (V. 2) și Tomato analyzer software27 au fost apoi utilizate pentru a estima lungimea și lățimea fructelor.

conținutul de zahăr și acid din fructe

zaharoza, glucoza și fructoza din fructe au fost cuantificate din 125 de soiuri în stadiul tamar, când fructele sunt uscate, maturarea este completă și stadiul la care datele sunt consumate în mod obișnuit. Fructele au fost congelate la -20 de grade C, iar între 10 și 15 fructe pe soi au fost menținute imediat la -20 de grade C, până la sosirea la Montpellier (Centrul francez de Cercetări Agricole Pentru Dezvoltare Internațională, CIRAD), unde s-a efectuat o analiză cromatografică lichidă de înaltă performanță. O singură măsurătoare din două fructe grupate a fost obținută pentru fiecare dintre trăsăturile de zahăr și acid. Piesele de curmale (fără piatră) au fost înghețate cu azot lichid și măcinate în pulbere, puse în două flacoane de sticlă etanșe separate, depozitate la -20 centi C până la prelevare. Pentru substanța uscată, în dublu exemplar, s-a cântărit 1 g de probă și s-a introdus într-o sobă sub vid la 70 de Centimetre C timp de 72 de ore. un control a fost verificat timp de 4 zile pentru a determina durata optimă. Extracțiile de zahăr au fost efectuate folosind metoda adaptată de la Bchir și colab.70. Pentru fiecare probă, pasta de curmale de 500 mg și 10 ml etanol 80% au fost plasate într-un tub de 15 ml, încălzit timp de 5 min la 80 centimetric C într-o baie de apă. Fiecare tub a fost apoi agitat la început manual și apoi mecanic timp de 15 minute pentru o mai bună răspândire. După centrifugare la 9000 de grame (Avanti j-e centrifuge; Beckman-Coulter, Brea, CA, SUA), fundul a fost extras de două ori și supernatanții s-au adunat, s-au filtrat la 0,45 de metri cubi și s-au injectat. Metoda a fost testată cu apă acidă (0,01 N H2SO4). Au fost utilizate standarde de probă Sigma-Aldrich (St.Louis, MO, SUA).

conținutul de umiditate al fructelor

eșantionarea fructelor a fost efectuată la fel ca în secțiunea privind conținutul de zahăr și acid din fructe de mai sus. Pulpa de curmale din două fructe a fost recuperată și măcinată cu azot lichid în vederea omogenizării probei și depozitată la -80 C pentru a se obține o singură măsurătoare pe Soi. Conținutul de umiditate a fost determinat gravimetric prin măsurarea pierderii în greutate a 2,5 g de probe de pastă de curmale, uscate la 70 centimetric C până când probele au atins o greutate stabilă.

analiza asocierii la nivelul genomului

am efectuat analiza mapării asocierii la nivelul genomului folosind pachetul Gapit R25. Pentru eficiența computațională și pentru a minimiza problemele de testare multiplă, dar pentru a oferi o acoperire densă în ceea ce privește distanța de descompunere LD, am folosit un set SNP aleatoriu redus de 5,5% (392.948 SNP). Un CMLM26 folosind atât structura populației, cât și informațiile de rudenie ca covariabile a fost efectuat pe genotipurile din cele 157 de probe de palmier dat. Structura populației a fost dedusă printr-o analiză a componentelor principale (PCA) generată de Gapit utilizând 1% din SNP-urile (eșantionate aleatoriu). Gapit a folosit în continuare primele cinci componente ale PCA (Fig. 1a; date suplimentare 2). Rudenia a fost dedusă folosind algoritmul VanRaden (date suplimentare 3). SNP-urile semnificative au fost identificate folosind un prag Bonferroni conservator de P < 1.27 10-7. Pentru trăsăturile cu rezultate semnificative, am efectuat în continuare o a doua analiză GWAS utilizând setul SNP complet pe anumite LG-uri în care au fost identificate SNP-uri semnificative.

caracterizarea lui Ibn Majid și a genei VIR

am identificat anterior un polimorfism de inserție retrotranspozon asemănător copiei în exonul 3 al unui factor de transcripție R2R3-MYB13 (ID-ul genei NCBI: LOC103717680) care este ortolog la Virescens (VIR) genă în ulei palmi28. Pentru a caracteriza acest retrotransposon, am amplificat PCR repetările terminale lungi ale elementului (precum și secvența genică vir adiacentă) în soiurile Thory și Empress colectate de la ferma USDA din Thermal, California și, respectiv, Ferma USDA/UC Riverside, folosind GoTaq PCR core Systems (Promega, Madison, WI USA) tampon și polimerază.

perechile de grunduri 5′-TGT GTC CGG CAT TGC ACT TCT-3′ (înainte) și 5′-GCT CAA TGT TGA TGT TCT TGT TGG-3′ (invers) au fost utilizate pentru 5′ LTR și 5′-ACTC TGA CTA CCA AGT ACT TGA TG-3′ (înainte) și 5′-CTG CAC TAT tat CAC AGT AGA TGG-3′ (invers) pentru 3′ ltr. Produsele amplificate au fost trimise pentru secvențierea Sanger la GeneWiz (South Plainfield, New Jersey). Ansamblul genomului nostru conține, de asemenea, o copie completă a inserției (~11,7 kb). BLAST a fost folosit pentru a alinia inserția împotriva ei însăși pentru a identifica regiunile de repetare terminale lungi potrivite. Programul LTRdigest71 a fost folosit pentru a confirma rezultatele exploziei. O căutare explozivă a interogat secvența completă Ibn Majid împotriva genomului palmei date pentru a determina numărul copiei.

tabelul suplimentar 11 oferă coordonatele adnotării noastre manuale a genei VIR în ansamblul masculin BC4. Genotiparea inserției Ibn Majid în exonul VIR 3 în soiurile de palmier de dată a fost efectuată prin inspecția manuală a citirilor aliniate care acoperă regiunea de inserție în JBrowse72. Deoarece ansamblul genomului masculin BC4 are alela de inserție (VIRIM, vezi Fig. 3), mapate citește provenind de la tip sălbatic (VIR+), sau non-Inserare alele, sunt moale-clipped la limita exon 3-Inserare. Am marcat prezența citirilor tăiate moale (susținând prezența unei alele VIR+) sau a citirilor neclipite care acoperă limita de inserție a exonului 3 (susținând prezența unei alele de inserție VIRIM) pentru identificarea genotipurilor. Am repetat această procedură examinând aliniamentele de citire atât la capetele 5′ cât și 3′ ale inserției în ansamblul mascul BC4 și probele în care atât genotipurile 5′ cât și 3 ‘ au dat genotipuri potrivite au fost reținute pentru analiză. Având în vedere interesul nostru pentru fenotipurile de culoare a fructelor, am genotipat doar palmele feminine.

caracterizarea invertazelor și polimorfismelor de deleție

examinarea genelor din compoziția zahărului QTL pe LG 14 (date suplimentare 6) a relevat inițial trei candidați poziționali—o invertază alcalină / neutră (chr14G0028200) și două invertaze adiacente peretelui celular (chr14G0022900 și chr14G0023100) prezise de conducta noastră de adnotare a genelor. Am verificat pentru potențiale copii suplimentare neanotate ale invertazei în această regiune prin alinierea transcrierilor prezise pentru fiecare dintre cele trei gene la această regiune folosind Splign transcript to genomic alignment tool73. Aceasta a recuperat o secvență minus strand (la care ne referim ca CWINV2), cu o omologie apropiată de invertazele flancante cwinv1 și CWINV3 la 2.489.373 la 2.485.592, dar Inserare/ștergeri multiple în regiuni omoloage cu invertaza CDs exoni.

adâncimea de acoperire pentru analiza variației de ștergere a fost determinată în recipiente de 500 bp care nu se suprapun cu samtools bedcov74 (v.1.9) Utilizarea setărilor implicite. Valorile adâncimii brute au fost normalizate independent pentru fiecare probă prin împărțirea adâncimii brute a fiecărui coș la adâncimea brută mediană a tuturor coșurilor de pe LG 14 în urma transformării log2 în urma florilor și colab.75. Probele au fost genotipate în deleție homozigotă și clase alternative de genotip pentru deleția de 40 kb prin inspecția manuală a fig. 12. Genotipuri homozigote pentru deleția în amonte de a / n-INV1 (Fig. 4, Suplimentar Fig. 13) au fost apelate prin stabilirea unui prag care necesită ca cel puțin un interval de 500 bp în regiunea de ștergere de 5 kb să aibă log2 normalizat adâncime mai mică de -5. În prezent, nu este posibil să se distingă heterozigoții pentru alelele de ștergere de homozigoții de inserție datorită acoperirii moderate din datele noastre de re-secvențiere.

testul enzimei Invertazei

pentru testul invertazei au fost alese două soiuri de zaharoză și două tipuri de zahăr reducător. Experimentul a fost realizat în două zile, toate cele patru soiuri fiind reprezentate de un singur fruct în fiecare zi. S-au efectuat teste pe un fruct khalal congelat în momentul colectării (a se vedea mai sus), urmat de depozitare la -80 C. extractele brute au fost obținute din fructul curmal congelat în conformitate cu protocolul Hasegawa și Smolensky33. Fiecare fruct congelat a fost pulverizat cu mortar și pistil (cu semințe îndepărtate), apoi măcinat într-un blender de bucătărie și 5 g plasate în tampon de extracție la rece (20 ml 4,0% NaCl, 1 g polivinilpirolidonă, PVP). O etapă suplimentară de macerare a fost efectuată într-un omogenizator de laborator timp de 1-2 minute. Extractul a fost apoi centrifugat la 20.000 XTX g timp de 15 min la 4 XTX C. supernatantul care conține invertază solubilă a fost depozitat pe gheață, iar restul a fost centrifugat a doua oară la 20.000 XTX g timp de 15 min la 4 XTX C. supernatanții au fost combinați și 10 ml dializați împotriva apei reci la 4 XTX peste noapte pentru a elimina zaharurile din extract. Eșantionul a fost apoi împărțit, iar jumătate din eșantion a fiert la 100 centimetric C pentru a măsura activitatea de fond din zahărul potențial contaminant din fruct. Activitatea invertazei extractelor brute neîncălzite și fierte a fost apoi măsurată prin test colorimetric pe un cititor de microplăci Synergy H1 cu un kit de analiză enzimatică cuplat (Sigma catalog nr. MAK118) urmând instrucțiunile producătorului.

analiza ARN-Seq a fructelor

au fost colectate două seturi de date ARN-Seq pentru a aborda întrebări despre dezvoltarea fructelor și variația trăsăturilor fructelor. ARN-Seq în diferite stadii de dezvoltare a fructelor a fost realizat pe fructe colectate în 2014 din copaci replicați situați pe terenul Universității din Emiratele Arabe Unite, Laboratorul de Cultură a țesuturilor de palmier din Al-Ain, Emiratele Arabe Unite. Pentru acest experiment, trei sau patru copaci separați de Khenezi (un soi cu fructe roșii) și Khalas (fructe galbene) au fost eșantionate în mod repetat la 45, 75, 105, 120 și 135 de zile după polenizare și fructe înghețate pe azot lichid. ARN-ul a fost extras dintr-un singur fruct din fiecare trei sau mai mulți copaci pe Soi, urmând Protocoalele standard pentru pregătirea bibliotecii TruSeq și 2 secventiere la capăt pereche de 101 BP efectuată pe un Illumina HiSeq 2500.un al doilea experiment a fost realizat pe fructele khalal stage colectate la ferma Al-Shuwaib în 2016. Au fost colectate trei fructe din fiecare dintre cele opt palme, fiecare dintr-un soi diferit ales pe baza faptului că se află la sau aproape de extremele distribuțiilor de tip zaharoză și zahăr reducător (adică concentrație mare și mică de zaharoză). Fructele au fost procesate așa cum este descris mai sus și bibliotecile construite cu Kit de pregătire a Bibliotecii Nextera (Illumina) și 2 secventiere pereche de 76 BP de 76 BP efectuată pe un instrument NextSeq (Illumina).

analiza expresiei diferențiale a fost realizată prin tunderea secvențierii brute citește cu Trimmomatic45 (v 0.36) cu parametrii ILLUMINACLIP: adaptor de la fasta:2:30:10 TRAILING:3 LEADING:3 SLIDINGWINDOW:4:15 MINLEN:36. Citirile au fost apoi aliniate la genomul de referință masculin BC4 cu aliniamentul de citire divizat în STELE47 (V.2.5.3A) și numărul de citire generat pe genă prin luarea Uniunii exonilor cu htseq-count76 (v.0.9.1) setat să includă numai citiri mapate unic (adică opțiuni htseq-count –type = exon–mode = union–nonunique = none). Normalizarea numărului de citire a fost efectuată cu metoda mediană a raporturilor DESeq277 (v.1.8.2). Testele de exprimare diferențială a Virescens (Pdac_HC_chr4G0137100) între soiurile roșu (Khenezi, n = 3 biblioteci replicate) și galben (Khalas, n = 3 sau 4 biblioteci replicate) au fost efectuate separat pentru fiecare dintre punctele de timp de dezvoltare a fructelor de 45, 75, 105, 120 și 135 de zile după polenizare. Valorile P sunt raportate pentru testul Wald al ipotezei fără diferență de pliere între expresia Khenezi și Khalas în fiecare etapă.

analiza ARN-seq a expresiei genei diferențiale a invertazelor A/N-INV1, CWINV1 și cwinv3 (Pdac_HC_chr14G0028200, Pdac_HC_chr14G0022900 și, respectiv, Pdac_HC_chr14G0023100) între zaharoză (n = 4 soiuri) și tipuri de zahăr reducător (n = 4 soiuri) a fost realizată prin construirea a trei biblioteci ARN extras independent din trei fructe diferite, urmate de secvențierea fiecărei biblioteci. Analiza expresiei diferențiale între soiurile de tip zaharoză și cele de tip reducător a fost apoi efectuată prin alinierea citirilor cu steaua (vezi mai sus), numărarea citirilor cu htseq-count și generarea matricelor de numărare brută în DESeq2. Numărul brut pe genă a fost apoi însumat în biblioteci pentru fiecare soi datorită numărului scăzut de citire în unele biblioteci. Analiza ulterioară a fost efectuată prin prima scădere a numărului scăzut de gene (gene cu <10 citiri însumate în toate cele 8 probe) urmată de fluxul de lucru standard DESeq2 (v. 1.22.2) cu patru replici biologice (adică., soiuri de palmier de date) în fiecare grup de tratament. Valorile P necorectate pentru ipoteza lipsei expresiei diferențiale sunt prezentate în textul principal pentru trei gene candidate.

rezumat de raportare

informații suplimentare privind proiectarea cercetării sunt disponibile în Rezumatul de raportare privind cercetarea naturii legat de acest articol.