Articles

Genome-wide association mapping of date palm fruit traits

Genome sequencing of the BC4 male

we sampled a backcross male date palm located at the United States Department of Agriculture (USDA)/University of California, Riverside farm in Thermal, California (USDA liittyminen No. PI 555415, lähde RIV 7545 PL). Tämä uros tuotti neljä sukupolvea backcrossing kanssa barhee naaras kuin toistuva vanhempi osana jalostusohjelmaa USDA, Yhdysvallat, joka lopetettiin 1970s10, 18. Lehtiset puhdistettiin ja pakastettiin nestemäisellä typellä ennen kuljetusta Arizonan genomiikan instituuttiin (Arizonan yliopisto, Tucson, AZ) suurimolekyylisen DNA: n erottamista ja sekvensointia varten.

BC4-uroksen genomi sekvensoitiin PacBio RSII-sekvensointialustan avulla. Molekyylipainoltaan suuri DNA sekvensointia varten erotettiin nuorista lehdistä Doylen ja Doyle42: n protokollan mukaisesti pienin muutoksin. PacBio library preparation seurasi 20 kb protokollaa ja kolme kirjastoa (gel-selected at 20, 25, ja 30 kb) rakennettiin. Kahdeksankymmentäviisi SMRT-kennoa sekvensoitiin RSII-sekvensserillä, jonka elokuvan keräysaika oli 6 h.lukemia kertyi noin 6,4 miljoonaa kappaletta, yhteensä 72 Gt dataa (keskileveyspituus 11.2 kb, N50 18.5 kb). Lyhyen inserttikirjaston (2 × 100 bp paripääty) lisäsekvensointi toteutettiin Illumina HiSeq 2500-sekvensserillä.

Genomikokoonpano

teimme k-mer-pohjaisen arvion genomin koosta BC4-miehen genomin raa ’ asta lyhyestä lukusekvenssistä kokoonpanotarkoituksiin (Kmerfreq_ar soapdenovo243: ssa) oletusasetuksilla ja K-mer-pituudeksi asetettiin 17. Huomaa, että kokeellinen genomin koon arvio P. dactyliferalle tehtiin myös virtaussytometrialla (KS.alla). PacBio lukee koottiin sitten FALCON-Unzip19 (v. falcon-2017.06.28–18.01-py2. 7-ucs2), jonka siemenpeitto on 55× ja K-mer-pohjaisen genomin kokoarvio 774 Mb syötteenä. Pura-moduuli ajettiin oletusasetuksilla.

tuloksena oleva kokoonpano kiillotettiin kohdistamalla raw PacBio readsview with Quiver and Arrow (osa SMRT-Analyysisarjaa v. 2.3.0), jonka jälkeen ajettiin Pilon44 v. 1.18 Illumina short read sequences from the BC4 male. Syötöt Piloniin tuotettiin trimmaamalla lyhyet lukemat Trimmomatic45: llä (v. 0.32), jolloin Q30: n peruslaadun alapuolella olevat 3′ emäkset ja lukemat olivat alle 30 nukleotidia. Tämän jälkeen readit linjattiin nuolen tulosteeseen Bowtie246: lla (v. 2.2.6).

kiillotetut primaariset kontigit ankkuroitiin olemassa olevan geneettisen map21: n LGs: ään ALLMAPS22: n avulla, jotta saatiin aikaan ankkuroitu haploidikokoonpano. Geenikartalle saatiin tukisekvenssejä http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gz. Kun linjaus geneettisen kartan ja kun manuaalinen tarkastus uudelleensuuntaus raw lukee kokoonpano, löysimme vain yksi esimerkki väärin kokoonpano: yksi contig piti jakaa, koska kaksi contig päät yhdistettiin head-to-head.

Genomihuomautus

loimme RNA-Seq-kirjastot useista khalal-vaiheen hedelmistä (katso alla), hede-ja emikukkanuppujen sekoituksesta (jäljempänä ”kukka”) ja siitepölystä, ja teimme 2 × 100 bp paripäätysekvenssin Illumina HiSeq 2500-instrumentille (täydentävä Taulukko 7). Päiväyspalmu-RNA-Seq: n lisätiedot lehdestä ja juuresta ladattiin Sekvenssilukuarkistosta (täydentävä Taulukko 7). RNA-Seq: n lukemat trimmomatic45: llä linjattiin HAPLOIDIKOKOONPANOON TÄHTI47: llä (v. 2.4.0.1) ja stringtie48: n ennustamilla geenimalleilla (v. 1.3.2) käytetään augustus49: n (v. 2.3) koulutuksena.

Geenitiedotus suoritettiin MAKER2-pipeline50-menetelmällä (v. 2.31). Homologiaan perustuvia todisteita olivat 7097 ESTs (ladattu NCBI EST-tietokannasta 9. helmikuuta 2017), proteiinisekvenssit Uniprot51: stä , taatelipalmun proteomi, öljypalmun proteomi52 ja RNA-Seq: n johdetut mallit edellä. Ab initio ennustaminen suoritettiin Augustus (v. 3.0) koulutettu kuten kuvattu Bowman et al.53 stringtie48: lla (v. 1.3.2) tuotetuilla geenimalleilla RNA-Seq-linjauksista.

raakaa MAKER2-merkintää jäsenneltiin, jolloin poistettiin malleja, jotka sisälsivät TE-verkkotunnuksia ja puuttuivat todisteet transkriptiosta tai pfam-verkkotunnuksen esiintymisestä, kuten Bowman et al-julkaisussa on kuvattu.53. Kanssa noin 1× ei-organellar yhden pään WGS Illumina lukee, de novo (ei assembly-pohjainen) toista kirjasto tuotettiin Reperexplorer54, ja jäsennellään kuten Copetti et al.55. Kokoonpanon toistuva huomautus suoritettiin Repermaskerilla (v. 4.0.6; nukleotidiavaruudessa) ja Blaster56: lla (osa REPET V 2.5-pakettia, proteiiniavaruudessa) ja myöhemmin sovitettiin yhteen yhteen merkintätiedostoon. Noncoding RNAs ennustettiin Infernal57: llä (v. 1.1.2) rfam library58: lla (v. 12.2). Osumat, jotka ylittivät e-arvorajan 1 × 10-5, suodatettiin pois, samoin kuin tulokset, joiden pistemäärä oli pienempi kuin perhekohtainen keräyskynnys. Kun molempien säikeiden lokit ennustettiin, vain korkeimmat pisteet saanut osuma jäi. Transfer RNAs ennustettiin myös käyttämällä trnascan-SE59 (v. 2.0) oletusparametreja.

genomin laadunarviointi

Genomikokoonpanon visualisoinnit tuotettiin assembly-stats-ohjelmistolla (Supplementary Fig. 1, ). Kokoonpanon täydellisyyttä arvioitiin luonnehtimalla geeniavaruus BUSCO20: lla käyttäen 1440: tä kasvien ortologiryhmää (v. 3) ja kohdistamalla ests diploidikokoonpanoon blat60: llä (v. 350).

Taatelipalmun genomin koon estimointi

genomin koko arvioitiin käyttäen yksivaiheista virtaussytometriamenetelmää, joka on kuvattu teoksessa Doležel et al.61 pienin muutoksin. Lyhyesti noin 1 cm2 lehtiainesta kahdesta P: stä. dactylifera näytteitä Royal Botanic Gardens, Kew, UK collection inkuboitiin 30 s jäällä 1 ml ”general purpose buffer” (GPB)62 täydennettynä 3% PVP-40 pehmentää lehtiä. Sitten samanlainen määrä lehtiä kalibrointistandardin Petroselinum crispum (Mill.) Fuss (1C-arvo = 2201 Mb)63 lisättiin ja yhdistetty materiaali pilkottiin nopeasti (mutta ei liian voimakkaasti) käyttäen uutta partaterää. GPB-puskuria lisättiin vielä 1 ml, minkä jälkeen homogenaatti suodatettiin 30 µm: n nailonverkon (Celltrics 30 µM mesh, Sysmex, Goritz, Saksa) läpi putkeen, 100 µl propidiumjodidia (1 mg/mL) ja näytettä inkuboitiin jäällä 10 minuutin ajan. 5000 hiukkasen suhteellinen fluoresenssi kirjattiin käyttämällä Partec Cyflow SL3-virtaussytometriä (Partec GmbH, Münster, Saksa), jossa on 100 mW: n vihreä solid-state-laser (532 nm, Cobolt Samba, Solna, Ruotsi). Jokaisesta lehdestä tehtiin kolme toisintoa, ja tuotosten histogrammit analysoitiin FlowMax-ohjelmiston v. 2 avulla.4 (Partec GmbH). P. dactyliferan (Mbp) 1C-arvo laskettiin seuraavasti: (P. dactyliferan huippuaseman keskiarvo/P. crispumin huippuaseman keskiarvo) × 2201 Mb (=P. crispumin 1C-arvo)63.

GWAS-paneeli

Gwas: n Fenotyypitys tehtiin taatelipalmuilla, jotka sijaitsivat kahdella maatilalla Yhdistyneissä Arabiemiirikunnissa. Maatilat sijaitsevat Taatelipalmujen tutkimuskeskuksessa Hamriyahissa, Ras Al-Khaimahissa (n = 46) ja Al-Shuwaibissa, Al-Ainissa, Abu Dhabissa (n = 111) . Populaatio koostuu pääasiassa naispuolisista kaupallisista lajikkeista (n = 145). Tiloilla kasvavat urokset (n = 12) myös jaksotettiin ensisijaisesti sukupuolen määrittävän lokuksen kartoittamiseksi.

khalal stage-hedelmänäytteet kerättiin keväästä syksyyn 2016, ja ne joko napsittiin pakastettuna nestemäiselle typelle RNA-sekvensointia varten tai kerättiin tuoreina hedelminä valokuvausta, skannausta (KS.alla) ja muiden hedelmien ominaisuuksien luonnehtimista varten. Tamar lavahedelmät samoista puista kerättiin kesällä 2017 sokeri-ja luomuhappoprofilointiin. Lehtinäytteitä kerättiin DNA: n uuttamista ja genomin sekvensointia varten.

genomi-DNA uutettiin joko lehti-tai hedelmämesokarpista / epikarp-kudoksesta kasvin dneasy mini kit (Qiagen, Venlo, Alankomaat) avulla. DNA extraction sarakkeet, ja kirjastot valmistettu Illumina Nextera (San Diego, CA) kit. 2 × 100 bp pariloppuinen sekvensointi suoritettiin Illumina HiSeq 2500-sekvensserillä, jossa oli jopa kahdeksan kirjastoa kaistaa kohden. Lukemat demultiplexed ja ohitettavat Illumina laadunvalvonta suodattimet käsiteltiin trimmomatic45 (v. 0.36) poistaa kontaminoivat adapteri sekvenssit. Adapterin poistoon käytimme adapteria ja Nextera transposase sequence-tietokantaa, joka on mukana trimmomatic (v. 0.32) – latauksessa seuraavalla asetuksella ILLUMINACLIP:〈adapter library〉:2:30:10 MINLEN:76, säilyttääksemme vain lukupareja, joissa molemmat lukemat olivat 76 bps tai pidempään trimmauksen jälkeen.

Reades oli linjassa unmasked BC4 male Assemblyn (primary contigs only) kanssa käyttäen BWA mem (V. 0.7.15-r1140 ). BWA mem aligner ajettiin-M-valinnalla täydentävien lukujen (0 × 800 bitwise-lippu) merkitsemiseksi toissijaiseksi (0 × 100). Näytelähetykset käsiteltiin fixmateinformationilla (Picard-tools v. 2.8.2; http://broadinstitute.github.io/picard) parilukutietojen johdonmukaisuuden varmistamiseksi, Samsortilla (Picard-tools v. 2.8.2) linjausten koordinoimiseksi, Markduplicaateilla (Picard-tools v. 2.8.2) päällekkäisten lukuparien merkitsemiseksi ja gatk64 IndelRealignerTargetCreator/IndelRealigner-työkalulla (gatk v. 3.7-0) muuttaa lukee Indel alueilla. Näytelähetykset validoitiin kussakin vaiheessa Validatesamin (Picard-tools v. 2.8.2) avulla sen varmistamiseksi, ettei tuotannossa ole virheitä. Käsitellyt linjaukset tiivistettiin CollectAlignmentSummaryMetrics (Picard-tools v. 2.8.2) ja Samtools.

SNP-kutsuminen ja genotyypitys

SNP-kutsuminen ja genotyypin määritys suoritettiin Gatk (v. 3.7-0) – Haplotyyppikalleroinnilla gvcf-tilassa, minkä jälkeen tehtiin yhteinen genotyypin määritys Genotyyppigvcfs: n kanssa . Reads suodatettiin Haplotyyppikalleusvaiheesta niiden poissulkemiseksi, joiden kartoituslaatu on alle 20, ja niiden poissulkemiseksi, jotka on merkitty polymeraasiketjureaktiokopioiksi tai sekundaarisiksi kohdistuksiksi (KS.edellä). Tämä lähestymistapa tuotti 32 384 028 SNP: tä kaikissa otoksissa. SNP-suodatus toteutettiin käyttämällä kovia suodattimia raa ’ an variantteihin gatk v. 4.0.2.1-menetelmällä. Suodatimme raakakutsujoukon sulkemaan pois SNP: t, joissa on pieni (<785) ja suuri syvyys (>2862) summattuna eri näytteissä. Poissuljimme myös monialleliset SNP: t, 10 bp: n sisällä olevat indel polymorfismit ja seuraavat ehdot täyttävät SNP: t: Kval < 30 ja QD < 5.0. Genotyypit todettiin puuttuviksi, jos DP oli alle 5 tai yli 20, samoin kuin SNPs, jonka genotyypin kutsutaajuus < 80% tai vähäinen alleelitaajuus alle 0, 01. Arvioimme p-arvon jokaiselle kohdalle Hardy-Weinbergin Tasapainotestissä käyttäen VCFtools65: tä ja suodatimme pois SNP: t, joissa on ylimääräinen heterotsygoottisuus (tarkka testi, p < 0,05). Tämä menettely tuotti suodatetun kutsusarjan 7 149 205 SNPs.

tilastollinen analyysi

kaikki tilastollinen analyysi tehtiin R-tilastollisella laskentakielellä, ellei toisin mainita.

LD-analyysi

LD estimoitiin käyttämällä R2-estimointimenetelmää, joka soveltuu perusteettomiin tietoihin (KS.VCFtools65). Gwas-paneelin LD-hajoamiskäyrä laskettiin kuten Flowers et al.4. Lyhyesti r2 laskettiin vaiheittaisille SNP–järjestelmille, joiden vähäisen alleelin taajuus on yli 10%, käyttäen-geno-LD-vaihtoehtoa Vcftooleissa (v. 0.1.14). Hajoamiskäyrät syntyivät sovittamalla käyrä pareittain R2-estimaatteihin fysikaalisella etäisyydellä SNP-parien välillä epälineaarisilla pienimmillä neliöillä käyttäen marroni et al-menetelmästä sovitettua lähestymistapaa.66. Puolihajoamisetäisyys laskettiin sitten etäisyydeksi, jolla r2 on puolet sen maksimiarvosta (eli 1 bp: n etäisyys).

hedelmien värin Luonnehdinta

korjattiin kahdeksan vahingoittumatonta khalal-vaiheen hedelmää taatelipalmulajiketta kohti, huuhdeltiin vesijohtovedellä mahdollisen pölyn poistamiseksi ja sitten ilmakuivattiin. Hedelmät viipaloitiin pitkittäin, ja hedelmien väri mitattiin kahdella strategialla. Ensin kuvasimme viipaloidut hedelmät värintarkistimella kamerakuvausstudion laatikkoon, jossa kuvat otettiin digitaalikameralla valkoisella pohjalla. Hedelmän väri analysoitiin ImageJ software67: llä käyttäen RGB-väriparametreja.

toiseksi käytimme täydentävää lähestymistapaa, jossa käytimme Tomato Analyzer software68 v. 2.2: ta saadaksemme arvioita väriparametreista L*, A*, b*. L * – koordinaatti ilmaisee värin tummuutta ja vaaleutta ja vaihtelee mustasta (0) valkoiseen (100). Koordinaatit A* ja b* ilmaisevat värisuuntaa, jossa + A* on punaisessa suunnassa, −a* vihreässä suunnassa, +b* keltaisessa suunnassa ja-b* sinisessä suunnassa68. Kuvan hankinta ja analyysi tehtiin kuvattu Rodríguez et al.27. Viipaloidut hedelmät oli sijoitettu skannerille, jossa oli musta tausta ja joka peitettiin ympäröivän valon vaikutusten välttämiseksi. Skannatut kuvat tallennettiin JPEG-tiedostoina ja jokaiselle hedelmälle tehtiin väriparametrien L*, A*, b* arviot. Kaikkien hedelmien keskiarvo laskettiin. Nämä kaksi menetelmää korreloivat hyvin keskenään, joten käytimme väri-indeksiä a*/b* arvioidaksemme hedelmien ihonvärien eroja ja käytimme sitä assosiaatiotutkimuksessa.

Hedelmäantosyaanipitoisuus

antosyaanin kokonaismäärä uutettiin khalal-vaiheen hedelmien kolmesta jäljennöksestä kustakin taatelipalmulajikkeesta käyttämällä fruits snap-frozen-valmistetta nestemäisellä typellä rabino-ja Mancinelli69-kohtien mukaisesti pienin muutoksin. Pakastetusta hedelmänkuoresta saatu antosyaani (100 mg) jauhettiin lyhyesti hienoksi jauheeksi ja uutettiin 1 ml: aan happamaa metanolia (1% HCl) inkuboimalla huoneenlämmössä pimeässä 18 tunnin ajan, minkä jälkeen sitä sentrifugoitiin 10 minuutin ajan 12 000 grammassa. Antosyaanin kokonaispitoisuuden kvantifiointi tehtiin spektrofotometrillä mitatun absorbanssin avulla käyttäen yhtälöä

antosyaanin Kokonaispituus = (A530-0,25 × A657) / FW, jossa A530 ja a657 nm ovat absorbanssi ja FW kasviaineksen märkäpaino (g).

Hedelmäkoko

värianalyysissä käytetyt hedelmäkuvat (KS.yllä) sisälsivät viivoittimen kokostandardiksi. ImageJ67 (v. 2) ja Tomato analyzer software27 käytettiin sitten arvioida hedelmien pituus ja leveys.

hedelmäsokeri ja happopitoisuus

Hedelmäsakkaroosi, glukoosi ja fruktoosi määritettiin 125 lajikkeesta siinä tamar-vaiheessa, jossa hedelmät ovat kuivia, kypsyminen on päättynyt ja jossa päivämäärät yleensä nautitaan. Hedelmät pakastettiin -20 °C: ssa, ja 10-15 hedelmää lajiketta kohti säilytettiin välittömästi -20 °C: ssa, kun ne saapuivat Montpellieriin (Ranskan maatalouden kansainvälisen kehityksen tutkimuskeskus CIRAD), jossa suoritettiin korkean erotuskyvyn nestekromatografinen analyysi. Jokaisesta sokerin ja hapon piirteestä saatiin yksi mittaus kahdesta yhdistetystä hedelmästä. Taatelipalat (ilman kiveä) jäädytettiin nestemäisellä typellä ja jauhettiin jauheena, pantiin kahteen erilliseen tiiviiseen lasipulloon, säilytettiin -20 °C: ssa näytteenottoon asti. Kuiva-aineen osalta punnittiin kahtena kappaleena 1 g näytettä ja se pantiin liedelle tyhjiössä 70 °C: ssa 72 tunnin ajan. optimikeston määrittämiseksi tarkastettiin 4 päivän ajan kontrolli. Sokerinuutot suoritettiin menetelmällä mukautettu bchir et al.70. Kutakin näytettä varten 500 mg taatelipastaa ja 10 ml 80-prosenttista etanolia laitettiin 15 ml: n putkeen, jota kuumennettiin 5 minuutin ajan 80 °C: n lämpötilassa vesihauteessa. Jokaista putkea vatkattiin ensin käsin ja sitten mekaanisesti 15 minuutin ajan, jotta se leviäisi paremmin. Sentrifugoinnin jälkeen 9000 × g (Avanti J-E sentrifugi; Beckman-Coulter, Brea, CA, USA) pohja uutettiin kahdesti ja supernatantit kerättiin, suodatettiin 0,45 µm: n tarkkuudella ja ruiskutettiin. Menetelmää testattiin happamalla vedellä (0,01 n H2SO4). Näyte standardit olivat Sigma-Aldrich (St. Louis, MO, USA) käytettiin.

hedelmien kosteuspitoisuus

hedelmänäytteet otettiin kuten yllä olevassa hedelmäsokeri-ja happopitoisuus-jaksossa. Kahdesta hedelmästä saatu taatelimassa otettiin talteen ja jauhettiin nestemäisellä typellä näytteen homogenoimiseksi ja varastoitiin -80 °C: n lämpötilaan, jotta lajiketta kohti saatiin yksi mittaus. Kosteuspitoisuus määritettiin gravimetrisesti mittaamalla 2,5 gramman taatelimassanäytteiden painonlasku, jota kuivatettiin 70 °C: ssa, kunnes näytteet saavuttivat vakaan painon.

genomin laajuinen assosiaatioanalyysi

suoritimme genomin laajuisen assosiaatiokartoitusanalyysin käyttäen Gapit R-pakettia 25. Laskennallisen tehokkuuden ja minimoida useita testaus kysymyksiä, mutta tarjota tiheä kattavuus suhteessa LD hajoaminen etäisyys, käytimme 5.5% downsampled random SNP set (392,948 SNPs). 157 taatelipalmunäytteen genotyypeille tehtiin cmlm26, jossa käytettiin sekä väestörakennetta että sukulaisuustietoa kovariaatteina. Väestörakenne pääteltiin pääkomponenttianalyysillä (PCA), jonka gapit tuotti käyttäen 1%: A kansallisista kansallisista järjestelmistä (satunnaisesti otetut). Gapit käytti lisäksi PCA: n viittä ensimmäistä komponenttia (Kuva. 1a; lisätiedot 2). Sukulaisuus on päätelty Vanradenin algoritmilla (lisätiedot 3). Merkittävät SNP: t tunnistettiin käyttämällä konservatiivista Bonferroni-kynnysarvoa P < 1,27 × 10-7. Ominaisuuksille, joilla oli merkittäviä tuloksia, teimme vielä toisen GWAS-analyysin käyttäen täydellistä SNP-sarjaa tiettyjen LGs: ien osalta, joissa huomattavat SNP: t tunnistettiin.

Ibn Majidin ja VIR-geenin Luonnehdinta

tunnistimme aiemmin kopian kaltaisen retrotransposonin insertiopolymorfian r2r3-MYB-transkriptiotekijän eksonissa 313 (NCBI-geenin ID: LOC103717680), joka on öljypalmussa olevan virescens (VIR) – geenin ortologinen. Tämän retrotransposonin luonnehtimiseksi me PCR-monistimme elementin pitkän terminaalin toistot (sekä viereisen VIR-geenisekvenssin) thory-ja Empress-lajikkeissa, jotka on kerätty USDA: n tilalta Thermal, California ja USDA/UC Riverside farm vastaavasti, käyttäen gotaq PCR-Ydinjärjestelmiä (Promega, Madison, WI USA) puskuria ja polymeraasia.

pohjapareja 5′-TGT GTC CGG CAT TGC ACT TCT-3′ (forward) ja 5′-GCT CAA TGT TGA TGT TGG-3′ (reverse) käytettiin 5′ LTR, ja 5′-ACTC TGA CTA CCA AGT ACT TGA TG-3′ (forward) ja 5′-CTG CAC TAT CAC AGT AGA TGG-3′ (reverse)) 3′ ltr. Täydennettyjä tuotteita lähetettiin Sanger sekvensointi genewiz (South Plainfield, New Jersey). Genomikokoelmamme sisältää myös täydellisen kopion insertiosta (~11.7 kb). Blastia käytettiin kohdistamaan lisäys itseään vastaan, jotta voitiin tunnistaa vastaavat pitkät terminaalin toistoalueet. RÄJÄHDYSTULOSTEN varmistamiseen käytettiin ohjelmaa LTRdigest71. RÄJÄHDYSHAUSSA koko Ibn Majid-sekvenssi verrattiin taatelipalmun genomiin kopionumeron määrittämiseksi.

täydentävässä taulukossa 11 on BC4-uroskokoonpanon vir-geenin manuaalisen huomautuksen koordinaatit. Ibn Majidin lisäyksen genotyypitys vir exon 3: ssa taatelipalmulajikkeissa suoritettiin manuaalisella tarkastuksella kohdistetuista lukemista, jotka kattoivat lisäysalueen jbrowse72: ssa. Koska BC4 miehen genomi kokoonpano on insertioalleeli (VIRIM, katso kuva. 3), kartoitetut lukemat, jotka ovat peräisin villityypistä (VIR+) eli ei-insertioituneet alleelit, ovat pehmeäleikkattuja ekson 3: n insertiorajalla. Pisteytimme genotyyppien tunnistamiseksi pehmeästi leikatut lukemat (jotka tukevat VIR+ alleelin esiintymistä) tai irralliset lukemat, jotka ulottuvat exon 3-insertiorajalle (tukevat virim-insertioalleelin esiintymistä). Toistimme tämän menettelyn tutkimalla lukulinjoja sekä 5′ ja 3′ päissä, jotka on lisätty BC4-uroskokoonpanoon, ja näytteitä, joissa sekä 5′ että 3 ’ genotyypeistä saadut vastaavat genotyypit säilytettiin analyysia varten. Koska olemme kiinnostuneita hedelmävärifenotyypeistä, genotyypitimme vain naaraspuoliset palmut.

invertaasien ja deleetiopolymorfismien Luonnehdinta

Sokerikoostumuksen QTL geenien tutkiminen LG 14: llä (lisätiedot 6) paljasti aluksi kolme positioehdokasta—emäksisen / neutraalin invertaasin (chr14G0028200) ja kaksi vierekkäistä soluseinän invertaasia (chr14G0022900 ja chr14G0023100), jotka geeniliittymäputkemme ennusti. Tarkistimme mahdollisia ylimääräisiä kopioita invertaasista tällä alueella kohdistamalla ennustetut transkriptit jokaiselle kolmesta geenistä tälle alueelle Splign transkriptiolla genomiseen kohdistustyökaluun73. Tämä talteen miinus juosteen sekvenssi (jota kutsumme nimellä CWINV2), jossa lähellä homologia reunustavat invertaasit CWINV1 ja CWINV3 2,489,373 ja 2,485,592, mutta useita lisäys/poistot alueilla homologisia invertaasi CDS eksonit.

peittosyvyys deleetiovaihteluanalyysille määritettiin 500 bp: ssä samtools bedcov74: n (v. 1.9) oletusasetusten käyttäminen. Raw-syvyysarvot normalisoitiin itsenäisesti kunkin näytteen osalta jakamalla kunkin roskakorin raaka-syvyys kaikkien laatikoiden raa ’ an syvyyden mediaanilla LG 14: llä sen jälkeen log2-muunnoksella Flowers et al: n jälkeen.75. Näytteet genotyypitettiin homotsygoottiseen deleetioon ja vaihtoehtoisiin genotyyppiluokkiin 40 kb: n deleetiolle tarkastamalla lisäkuva manuaalisesti. 12. Homotsygoottiset genotyypit deleetiota edeltävälle A/N-INV1: lle (Kuva. 4, Täydentävä Kuva. 13) kutsuttiin asettamalla kynnys, joka edellyttää, että vähintään yksi 500 bp intervalli 5 kb poistoalueella on log2 normalisoitu syvyys alle -5. Tällä hetkellä ei ole mahdollista erottaa heterotsygootteja poistoalleeleille insertiohomotsygooteista, koska uusintasekvenssitiedoissamme on kohtalaista kattavuutta.

Invertaasientsyymimääritys

invertaasimääritykseen valittiin kaksi sakkaroosia ja kaksi pelkistävää sokerilajiketta. Koe suoritettiin kahtena päivänä, ja kaikkia neljää lajiketta edusti yksi hedelmä jokaisena päivänä. Määritykset tehtiin yhdellä khalal-vaiheen hedelmillä, jotka on pakastettu keräyshetkellä (KS.edellä), minkä jälkeen ne varastoitiin -80 °C: ssa. jäädytetyistä taatelihedelmistä saatiin raakoja uutteita Hasegawan ja Smolensky33: n protokollan mukaisesti. Jokainen jäädytetty hedelmä jauhettiin morttelilla ja survimella (siemen poistettu) ja jauhettiin sitten keittiösekoittimella ja 5 g pantiin kylmäuuttopuskuriin (20 ml 4,0% NaCl, 1 g polyvinyylipyrrolidonia, PVP). Lisäksi maserointia tehtiin laboratoriohomogenisaattorissa 1-2 minuutin ajan. Tämän jälkeen uutetta sentrifugoitiin lämpötilassa 20 000 × g 15 minuutin ajan 4 °C: ssa.liukoista invertaasia sisältävä supernatantti varastoitiin jäähän ja loput sentrifugoitiin toisen kerran lämpötilassa 20 000 × g 15 minuutin ajan 4 °C: ssa. supernatantit yhdistettiin ja 10 ml dialysoitiin kylmää vettä vastaan 4° yön yli sokerien poistamiseksi uutteesta. Tämän jälkeen näyte halkaistiin, ja puolet näytteestä keitettiin 100 °C: n lämpötilassa, jotta voitiin mitata hedelmästä mahdollisesti kontaminoivan sokerin Tausta-aktiivisuus. Keittämättömien ja keitettyjen raakauutteiden invertaasiaktiivisuus mitattiin kolorimetrisellä määrityksellä synergia H1-mikrotiitterilevyn lukulaitteella, jossa oli kytketty entsyymimäärityspaketti(Sigma catalog no. MAK118) valmistajan ohjeiden mukaisesti.

hedelmien RNA-Seq-analyysi

kaksi RNA-Seq-tietokokonaisuutta kerättiin vastaamaan kysymyksiin hedelmien kehityksestä ja hedelmien ominaisuuksien vaihtelusta. RNA-Seq eri hedelmien kehitysvaiheissa suoritettiin hedelmillä, jotka kerättiin vuonna 2014 monistepuista, jotka sijaitsevat Arabiemiirikuntien yliopiston Taatelipalmun Kudosviljelmälaboratorion alueella Al-Ainissa, Arabiemiirikunnissa. Tässä kokeessa kolme tai neljä erillistä puuta Khenezi (lajike punainen hedelmä) ja Khalas (keltainen hedelmä) lajikkeiden otettiin toistuvasti 45, 75, 105, 120 ja 135 päivää pölytyksen jälkeen ja hedelmät snap-jäädytetty nestemäisellä typellä. RNA uutettiin yhdestä hedelmästä jokaisesta kolmesta tai useammasta puusta lajiketta kohti truseq-kirjastovalmistelun standardiprotokollien mukaisesti, ja 2 × 101 bp paripäätysekvensointi suoritettiin Illumina HiSeq 2500: lla.

toinen koe tehtiin Al-Shuwaibin tilalta kerätyillä khalal stage-hedelmillä vuonna 2016. Kolme hedelmää kerättiin jokaisesta kahdeksasta eri lajikkeesta, joista kukin oli valittu sen perusteella, että ne olivat sakkaroosin äärirajoilla tai lähellä niitä ja vähensivät sokerityyppien jakaumia (eli korkea ja alhainen sakkaroosipitoisuus). Hedelmät käsiteltiin edellä kuvatulla tavalla ja kirjastot rakennettiin Nextera library preparation kit (Illumina) ja 2 × 76 bp paripäätysekvenssillä nextseq (Illumina)-laitteella.

Differential expression analysis suoritettiin trimmaamalla RAW-sekvensointi lukee Trimmomatic45 (v 0.36) parametreilla ILLUMINACLIP:〈adapter fasta〉:2:30:10 perään:3 LEADING:3 SLIDINGWINDOW:4:15 MINLEN:36. Readit linjattiin tämän jälkeen BC4-urosviittausgenomiin TÄHTIJAKAUMAN lukeman aligner47 (v. 2.5.3a) ja lukumäärät, jotka on luotu per geeni ottamalla eksonien liitto htseq-count76: lla (v. 0.9.1), jotka on asetettu sisältämään vain yksikäsitteisesti kartoitetut lukemat (eli htseq-count options –type = exon–mode = union–nonunique = none). Lukuarvojen normalisointi toteutettiin deseq277: n mediaani-of-ratio-menetelmällä (v. 1.8.2). Virescens (Pdac_HC_chr4G0137100) – lajikkeiden erotusilmaisutestit punaisen (Khenezi, n = 3 rinnakkaista kirjastoa) ja keltaisen (Khalas, n = 3 tai 4 rinnakkaista kirjastoa) välillä tehtiin erikseen kullekin hedelmän kehitysajankohdalle, joka oli 45, 75, 105, 120 ja 135 päivää pölytyksen jälkeen. P-arvot ilmoitetaan Waldin testille, jossa testataan hypoteesia, jonka mukaan khenezin ja Khalasin lausekkeiden välillä ei ole kertaeroa kussakin vaiheessa.

RNA-seq-analyysi invertaasien A/n-INV1, CWINV1 ja CWINV3 (Pdac_HC_chr14G0028200, Pdac_HC_chr14G0022900 ja Pdac_HC_chr14G0023100) geeniekspression erosta sakkaroosin (N = 4 muunnosta) ja pelkistävän sokerin tyypin (N = 4 muunnosta) välillä tehtiin rakentamalla kolme kirjastoa lajiketta kohti RNA erotettiin itsenäisesti kolmesta eri hedelmästä, minkä jälkeen jokainen kirjasto sekvensoitiin. Tämän jälkeen analysoitiin sakkaroosityyppisten ja pelkistävien lajikkeiden erotusilmaisua kohdistamalla lukemat tähtiin (KS.edellä), laskemalla lukemat htseq-countilla ja tuottamalla Raakalukumatriisit DESeq2: ssa. Raakaluvut per geeni laskettiin sitten yhteen kirjastoissa kunkin lajikkeen osalta joidenkin kirjastojen alhaisten lukumäärien vuoksi. Myöhempi analyysi tehtiin pudottamalla ensin vähälukuiset geenit (geenit, joiden <10 lukua yhteenlaskettuna Kaikkien 8 näytteen kohdalla), joita seurasi standardi DESeq2 (v. 1.22.2) työvirta, jossa oli neljä biologista toisintoa (ts., taatelipalmulajikkeet) kussakin käsittelyryhmässä. Oikaistut p-arvot hypoteesille, jonka mukaan differentiaalista ekspressiota ei ole, esitetään päätekstissä kolmelle kandidaattigeenille.

raportointikooste

lisätietoja tutkimuksen suunnittelusta on tämän artikkelin yhteydessä olevassa Nature Research Reporting Summary-julkaisussa.