Articles

Genom-wide association feltérképezése, a datolyapálma gyümölcse tulajdonságok

Genom szekvenálás a BC4 férfi

vettünk egy visszakeresztezési férfi dátuma palm található az amerikai Egyesült Államok Mezőgazdasági minisztériuma (USDA)/Kaliforniai Egyetem, Riverside farm Termikus, Kalifornia (USDA csatlakozás Nem. PI 555415, forrás RIV 7545 PL). Ezt a hímet négy nemzedéknyi backcrossing állította elő egy Barhee nősténnyel, mint visszatérő szülővel az USDA-ban (USA) tenyésztési program részeként, amelyet az 1970-es években megszüntettek10,18. A szórólapokat az Arizonai genomikai Intézetbe (University of Arizona, Tucson, AZ) történő szállítás előtt folyékony nitrogénen megtisztították és lefagyasztották, nagy molekulatömegű DNS és szekvenálás céljából.

a BC4 hím genomját egy PacBio RSII szekvenáló platform segítségével szekvenálták. A szekvenáláshoz szükséges nagy molekulatömegű DNS-t a Doyle és a Doyle42 protokollját alkalmazó fiatal levelekből nyerték ki kisebb módosításokkal. A PacBio könyvtár előkészítése a 20 kb protokollt követte, és három könyvtárat (20, 25 és 30 kb) építettek. Nyolcvanöt SMRT sejtek szekvenált egy RSII sequencer a film gyűjtemény idő 6 óra. Körülbelül 6,4 millió olvassa keletkezett, összesen 72 Gb adat (vagyis subread hossza 11.2 kb, N50 18.5 kb). Egy rövid betétkönyvtár (2 × 100 bp párosított vég) további szekvenálását egy Illumina HiSeq 2500 szekvencerrel végezték.

Genom assembly

k-mer alapú becslést készítettünk a BC4 férfi Genom nyers rövid olvasási szekvenciáiról összeszerelési célokra (KmerFreq_AR a SOAPdenovo243-ban), alapértelmezett beállításokkal és K-mer Hossz 17-re állítva. Vegye figyelembe, hogy a P. dactylifera kísérleti genomméretének becslését áramlási citometriával is elvégezték (lásd alább). A PacBio olvasókat ezután FALCON-Unzip19 (V. falcon-2017.06.28–18.01-py2. 7-ucs2) 55× maggal és a K-mer alapú genomméret becsléssel 774 Mb bemenetként. Az Unzip modul alapértelmezett beállításokkal futott.

Az eredmény közgyűlés volt csiszolt elhelyezésével, nyers PacBio olvassa a Tegez Nyíl (része a SMRT Elemzés suite v. 2.3.0), majd futó Pilon44 v. 1.18 a Illumina rövid olvassa el szekvenciák a BC4 férfi. Bemenetek, hogy Pilon kerültek elő a vágás a rövid olvassa a Trimmomatic45 (v. 0.32), hogy távolítsa el 3′ bázisok alatti bázis minőségi Q30 olvas rövidebb, mint 30 nukleotid. Az olvasást ezután a Bowtie246 nyíl kimenetéhez igazították (v. 2.2.6).

a polírozott elsődleges összefüggéseket a meglévő genetikai map21 LGs-hez rögzítettük ALLMAPS22-vel, hogy rögzített haploid szerelvényt állítsunk elő. A genetikai térkép állványszekvenciáit http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gz – ból nyerték. A genetikai térképhez való igazítás után és a nyers olvasmányok összeszerelésének kézi ellenőrzése után csak egy hibás összeszerelést találtunk: egy contigot meg kellett osztani, mivel két contig végét fej-fejre egyesítették.

Genom annotáció

RNS-Seq könyvtárakat hoztunk létre több khalális stádiumú gyümölcsből (lásd alább), hím és női virágrügyek keverékéből (az alábbiakban “virág” néven), valamint pollenből, és 2 × 100 bp párosított végű szekvenálást végeztünk egy Illumina HiSeq 2500 műszeren (7.kiegészítő táblázat). További dátum palm RNS-Seq adatokat a levélből és a gyökérből töltöttek le a Szekvenciaolvasási archívumból (7.kiegészítő táblázat). Az RNS-Seq leolvasásokat Trimmomatic45-Tel vágták le, igazítva a haploid szerelvényhez a STAR47-Tel (v. 2.4.0.1), valamint a StringTie48 által előrejelzett génmodellekkel (v. 1.3.2) az Augustus49 (v. 2.3) képzésére kell használni.

A Génmegjegyzést a MAKER2 pipeline50 (v.2.31) segítségével végezték. Homológia alapú bizonyítékok, beleértve 7097 ESTs (letölthető NCBI EST adatbázis február 9, 2017), fehérje szekvenciák Uniprot51, dátum palm proteome, olajpálma proteome52, és az RNS-Seq származó modellek felülről. Ab initio jóslás végeztük Augustus (v. 3.0) képzett leírt Bowman et al.53 A StringTie48-Mal (v. 1.3.2) előállított génmodellekkel, az RNS-Seq nyomvonalakból.

a raw MAKER2 annotációt elemezték, eltávolítva a TE domaineket tartalmazó modelleket, és nem volt bizonyíték a transzkripcióra vagy a Pfam domain jelenlétére a Bowman et al.53. A mintegy 1× nem organelláris egyvégű WGS Illumina olvasás, de novo (nem összeszerelés alapú) ismétlés könyvtárat állítottak elő a Repeatexplorer 54, és elemzi, mint a Copetti et al.55. Az összeszerelés ismételt annotációját Repeatmaskerrel (V. 4.0.6; nukleotid térben) és Blaster56-tal (a REPET v 2.5 csomag része, fehérjetérben) végezték, majd később egyetlen annotációs fájlba illesztették. A nem kódolt RNS-eket az Infernal57 (v. 1.1.2) az Rfam library58 (v. 12.2) segítségével jósolták meg. Az 1 × 10-5-ös e-értékküszöb feletti találatokat kiszűrtük, valamint a családspecifikus gyűjtési küszöbértéknél alacsonyabb pontszámmal rendelkező eredményeket. Amikor mindkét szálon loci-t jósolták, csak a legmagasabb pontszámmal rendelkező találatot tartották meg. Transfer RNS is megjósolták a trnascan-SE59 (v. 2.0) alapértelmezett paraméterekkel.

Genomminőség-értékelés

a genomegység vizualizációit összeszerelési statisztikai szoftverrel (kiegészítő ábra. 1, ). Az összeszerelés teljességét úgy értékelték, hogy a GÉNTERÜLETET BUSCO20-val jellemezték 1440 növényi ortolog csoport (V. 3) segítségével, valamint az est-ket a diploid szerelvényhez igazították Blat60 (v. 350).

dátum palm genomméret becslés

a genom méretét a Doležel et al.61 enyhe módosításokkal. Röviden, körülbelül 1 cm2 levél anyag Két P. dactylifera mintákat a Royal Botanic Gardens, Kew, UK gyűjtemény inkubáltuk 30 s jégen 1 ml “általános célú puffer” (GPB)62 kiegészítve 3% PVP-40, hogy tompítsa a levél. Ezután hasonló mennyiségű levélanyag a kalibrációs standard Petroselinum crispum (Malom.) (1C érték = 2201 Mb) 63-at adtak hozzá, és a kombinált anyagot gyorsan (de nem túl erőteljesen) aprították egy új borotvapengével. További 1 ml GPB puffert adtunk hozzá, majd a homogenizátumot egy 30 µm-es nejlonhálón (Celltrics 30 µM mesh, Sysmex, Goritz, Németország) szűrtük egy csőbe, 100 µl propidium-jodidot (1 mg/mL) adtunk hozzá, majd a mintát 10 percig jégen inkubáltuk. Az 5000 részecske relatív fluoreszcenciáját egy Partec Cyflow SL3 áramlási citométerrel (Partec GmbH, Münster, Németország) rögzítették, amely 100 mW zöld szilárdtest lézerrel (532 nm, Cobolt Samba, Solna, Svédország) volt felszerelve. Minden levélből három ismétlést dolgoztunk fel, a kimeneti hisztogramokat pedig a FlowMax V. 2 szoftver segítségével elemeztük.4 (Partec GmbH). A P. dactylifera (Mbp) 1C értékét a következőképpen számítottuk ki: (a P. dactylifera átlagos csúcspozíciója/a P. crispum átlagos csúcspozíciója) × 2201 Mb (=a P. crispum 1C értéke)63.

GWAS panel

a GWAS Fenotipizálását az Egyesült Arab Emírségek két gazdaságában található pálmafákon végezték. A gazdaságok Hamriyah, Ras Al-Khaimah (n = 46) és Al-Shuwaib, Al-Ain, Abu Dhabi (n = 111) Dátumpálma Kutatóközpontjában találhatók . A lakosság elsősorban női kereskedelmi fajtákból áll (n = 145). A gazdaságokban növekvő hímeket (n = 12) szintén szekvenálták elsősorban a nemi meghatározási hely feltérképezése céljából.

2016 tavasztól őszig gyümölcsmintákat gyűjtöttek, és vagy folyékony nitrogénre fagyasztva RNS-szekvenáláshoz, vagy friss gyümölcsként gyűjtötték be fényképezésre, szkennelésre (lásd alább) és más gyümölcsjellemzők jellemzésére. 2017 nyarán ugyanabból a fáról származó Tamar stage gyümölcsöket gyűjtöttek össze cukor és szerves sav profilalkotásra. Levélmintákat gyűjtöttek DNS-extrakcióhoz és genomszekvenáláshoz.

a genomikus DNS-t levél vagy gyümölcs mesocarp/epicarp szövetből nyerték ki növényi dneasy mini kit (Qiagen, Venlo, Hollandia) segítségével. DNS-kivonó oszlopok és könyvtárak, amelyeket Illumina Nextera (San Diego, CA) készlet segítségével készítettek. Egy 2 × 100 bp párosított végű szekvenálást végeztek egy Illumina HiSeq 2500 szekvenátoron, sávonként legfeljebb nyolc könyvtárral. A leolvasásokat demultiplexelték, az Illumina minőségellenőrző szűrőket pedig Trimmomatic45 (V. 0.36) segítségével dolgozták fel a szennyező adapterszekvenciák eltávolítására. Az adapter eltávolításához a Trimmomatic (V. 0.32) letöltéshez mellékelt adaptert és a Nextera transposase szekvencia adatbázist használtuk a következő beállítással ILLUMINACLIP:〈adapter könyvtár〉:2:30:10 MINLEN:76 hogy csak olvasási párokat tároljunk, ahol mindkét olvasás 76 bps vagy hosszabb volt a vágás után.

az olvasásokat a BWA mem (V. 0.7.15-r1140) segítségével igazították a nem maszkolt BC4 férfi szerelvényhez (csak elsődleges összefüggések ). A BWA mem aligner-T A-M opcióval futtatták, hogy másodlagos (0 × 800 bitenkénti zászló) kiegészítő olvasásokat jelöljenek meg (0 × 100). Minta nyomvonalakat dolgoztunk fel FixMateInformation (Picard-tools v. 2.8.2; http://broadinstitute.github.io/picard), hogy biztosítsa a következetesség párosított olvasási információk, SamSort (Picard-tools v. 2.8.2), hogy koordinálja-sort a nyomvonalakat, MarkDuplicates (Picard-tools v. 2.8.2) megjelölni duplikált olvasási pár, és GATT64 IndelRealignerTargetCreator/indelrealigner eszköz (Gatk V.3.7-0) a felháborodás olvas az Indel régiókban. A mintaigazításokat minden lépésben validatesam (Picard-tools v. 2.8.2) segítségével validálták, hogy a gyártás során ne legyenek hibák. A feldolgozott nyomvonalakat Gyűjtőjelekkel (Picard-tools v. 2.8.2) és Samtoolokkal foglaltuk össze .

SNP calling and genotyping

SNP-calling and genotyping was performed with the GATK (V .3.7-0) HAPLOTYPECALLER run in GVCF mode followed by joint-genotyping with GenotypeGVCFs. Olvassa volt szűrt a HaplotypeCaller lépés, hogy kizárja azokat a leképezés minőségi kevesebb, mint 20, illetve, hogy kizárja azokat a jelölt, mint a polimeráz láncreakció (PCR) másolatok, vagy másodlagos módosításokat (lásd fent). Ez a megközelítés 32 384 028 SNP-t eredményezett az összes mintában. Az SNP szűrést úgy hajtottuk végre, hogy kemény szűrőket alkalmaztunk a nyers változatokra a GATK v. 4.0.2.1 használatával. Szűrtük a raw híváskészletet, hogy kizárjuk az SNP-ket alacsony (<785) és nagy mélységű (>2862) mintákon összegezve. Azt is kizárta, multi-allélikus SNPs, SNPs belül 10 bp a indel polimorfizmusok, valamint SNPs megfelel a következő feltételeknek: QUAL < 30 QD < 5.0. A genotípusok hiányosak voltak, ha a DP 5 vagy 20 alatt volt, valamint a < 80% genotípusú hívási arányú SNP-k, vagy 0, 01 alatti kisebb allélfrekvencia. Becsléseink szerint a P-érték mindkét oldalon a Hardy–Weinberg Egyensúly teszt segítségével VCFtools65 pedig kiszűri SNPs mutató meghaladja a heterozygosity (pontos teszt, P < 0.05). Ez az eljárás 7,149,205 SNPs szűrt híváskészletet eredményezett.

statisztikai elemzés

az összes statisztikai elemzést r statisztikai számítási nyelven végezték, hacsak másként nem jelezzük.

ld analízis

az LD-t az R2 becslésére szolgáló módszerrel becsülték meg, amely megfelel a nem alapozott adatoknak (lásd VCFtools65). A GWAS panel ld bomlási görbéjét a Flowers et al.4. Röviden, az r2–t a vcftools-ban (V. 0.1.14) a-geno-ld opcióval 10% – nál nagyobb kisebb allélfrekvencia nélküli SNP-kre számították. A bomlási görbéket úgy hozták létre, hogy egy görbét illesztettek a páronkénti r2 becslésekhez az SNP párok közötti fizikai távolság alapján, a nemlineáris legkisebb négyzetekkel, a Marroni et al.66. A fél-bomlási távolságot ezután úgy számították ki, mint azt a távolságot, amelyen az r2 a maximális értékének fele (azaz 1 bp távolság).

jellemzése gyümölcs színe

nyolc khalal stage gyümölcsök sérülésmentes per dátum palm fajta betakarított, öblítjük csapvízzel, hogy távolítsa el a port, majd levegőn szárított. A gyümölcsöket hosszirányban szeletelték, majd a gyümölcs színét két stratégiával mérték. Először egy színes ellenőrzővel fényképeztük a szeletelt gyümölcsöket egy fényképezőgép-stúdió dobozban, ahol a képeket fehér alapon, digitális fényképezőgéppel készítettük. A gyümölcs színét az ImageJ software67 segítségével elemeztük az RGB színparaméterek segítségével.

másodszor, kiegészítő megközelítést alkalmaztunk, ahol Paradicsomelemző szoftvereket használtunk68 V. 2.2 az L*, a*, b * színparaméterek becsléséhez. Az L * koordináta a sötétséget és a szín könnyedségét fejezi ki, a fekete (0) – tól a fehérig (100) terjed. Koordinálja az A* és b* expressz színirányt, ahol +a* A piros, −a* A zöld, +b* a sárga és −B* a kék irányban68. A képgyűjtés és-elemzés a Rodríguez et al.27. A szeletelt gyümölcsöket fekete háttérrel ellátott szkennerre helyezték, hogy elkerüljék a környezeti fény hatásait. A beolvasott képeket JPEG fájlként mentettük, az L*, A*, b* színparaméterek becslését pedig minden gyümölcsön elvégeztük. Az összes gyümölcs átlagát kiszámították. A két módszer erősen korrelált, ezért az A*/b* színindexet használtuk annak érdekében, hogy értékeljük a gyümölcsök bőrszíneinek különbségeit, és ezt használtuk az asszociációs tanulmányhoz.

Gyümölcs antocianin-tartalom

Összes antocianin volt kivont három ismétlést a khalal színpadon gyümölcs minden datolyapálma különböző segítségével gyümölcsök snap-fagyott a folyékony nitrogén következő a leírt eljárás a Rabino, valamint Mancinelli69 kisebb módosítás. Röviden, antocianin a fagyasztott gyümölcs bőr (100 mg) volt a föld a finom por, s kivont 1 ml savas metanol (1% – os HCl) által inkubálás szobahőmérsékleten, sötétben 18 h, majd centrifugálás 10 perc 12,000 g. A teljes antocianin számszerűsítése spektrofotométerrel mért abszorbancia segítségével történt, a

Total antocianin = (A530-0,25 × A657)/FW egyenlet alkalmazásával, ahol A530 és A657 nm az abszorbancia, az FW pedig a növényi anyag nedves tömege (g).

Gyümölcsméret

a színelemzéshez használt gyümölcsfotók (lásd fent) egy vonalzót tartalmaztak méretszabványként. Ezután az ImageJ67 (v. 2) és a Paradicsomelemző szoftvereket27 használták a gyümölcs hosszának és szélességének becslésére.

gyümölcscukor és savtartalom

Gyümölcsszacharózt, glükózt és fruktózt számszerűsítettek 125 fajtából a tamar szakaszban, amikor a gyümölcsök szárazak voltak, az érés befejeződött, és a dátumokat jellemzően fogyasztották. A gyümölcsöket -20 °C-on fagyasztották be, és fajtánként 10-15 gyümölcsöt azonnal -20 °C-on tartottak a Montpellier-be (Francia Nemzetközi Fejlesztési mezőgazdasági Kutatóközpont, CIRAD) érkezéskor, ahol nagy teljesítményű folyadékkromatográfiás elemzést végeztek. Az egyes cukor-és savjellemzők tekintetében két összevont gyümölcsből egy-egy mérést végeztek. A dátumdarabokat (a kő nélkül) folyékony nitrogénnel fagyasztották és porrá őrölték, két különálló, szoros üvegbe helyezték, -20 °C-on tárolták a mintavételig. A szárazanyag -, két példányban, 1 g minta megmérjük, majd elhelyezett tűzhely vákuum alatt, 70 °C 72 h. Ellenőrző ellenőrizték 4 napig, hogy meghatározza az optimális időtartamát. A cukor extrakciókat a Bchir et al.70. Minden mintához 500 mg datolyapasztát és 10 ml 80% etanolt helyeztünk egy 15 ml-es csőbe, amelyet 5 percig melegítettünk 80 °C-on vízfürdőben. Ezután minden csövet először manuálisan, majd mechanikusan 15 percig kevertek a jobb terjedés érdekében. 9000 × g-os centrifugálás után (Avanti J-E centrifuga; Beckman-Coulter, Brea, CA, USA) az alját kétszer extrahálták, a szupernatánsokat összegyűjtötték, 0,45 µm-en szűrték, majd befecskendezték. Az eljárást savas vízzel (0,01 N H2SO4) teszteltük. A Mintaszabványok Sigma-Aldrich (St. Louis, MO, USA) voltak.

gyümölcs nedvességtartalom

Gyümölcsmintavételre került sor, mint a gyümölcscukor és savtartalom fenti szakaszban. A két gyümölcsből származó dátumpépet folyékony nitrogénnel kinyerték a minta homogenizálására, és -80 °C-on tárolták, hogy fajtánként egyetlen mérést kapjanak. A nedvességtartalmat gravimetrikusan határoztuk meg 2, 5 g dátumpépminták súlycsökkenésének mérésével, 70 °C-on szárítva, amíg a minták stabil súlyt nem értek el.

Genom-szintű asszociációs analízis

a genomra kiterjedő asszociációs leképezési elemzést a Gapit r package25 segítségével hajtottuk végre. A számítási hatékonyság érdekében, valamint a többszörös tesztelési problémák minimalizálása érdekében, de az LD bomlási távolságához képest sűrű lefedettséget biztosítunk, 5,5% – os downsampled véletlenszerű SNP-készletet használtunk (392,948 SNPs). A 157 datolyapálma-mintából származó GENOTÍPUSOKON egy CMLM26-ot végeztek, amely mind a populációs struktúrát, mind a rokonsági információkat kovariátumként használta. A populáció szerkezetét a Gapit által generált főkomponens-elemzéssel (PCA) vonták le az SNP-k 1% – ának felhasználásával (véletlenszerűen mintavételezett). A Gapit tovább használta a PCA első öt összetevőjét (ábra. 1a; kiegészítő adatok 2). A rokonságra a VanRaden algoritmus (kiegészítő adatok 3) segítségével következtettek. Jelentős SNP-ket azonosítottak a p < 1,27 × 10-7 konzervatív Bonferroni küszöbértékével. A jelentős eredményekkel rendelkező tulajdonságok esetében egy második GWAS-elemzést végeztünk az adott LGs-en beállított teljes SNP-vel, ahol jelentős SNP-ket azonosítottunk.

az Ibn Majid és a VIR gén jellemzése

korábban egy r2r3-MYB transzkripciós faktor13 (NCBI gén ID: LOC103717680), amely az olajpálma Virescens (VIR) génjének ortológusa.28 Ennek a retrotranszpozonnak a jellemzéséhez a hosszú terminális ismétléseket (valamint a szomszédos VIR génszekvenciát) a kaliforniai USDA farmon, illetve az USDA/UC Riverside farmon gyűjtött Thory és Empress fajtákban, GoTaq PCR Magrendszerek (Promega, Madison, WI USA) puffer és polimeráz felhasználásával.

az alapozó Párok 5′-TGT GTC CGG CAT TGC ACT TCT-3′ (előre) és 5′-GCT CAA TGT TGT TCT TGT TGG-3′ (hátra) az 5′ LTR-hez, az 5′-ACTC TGA CTA CCA AGT ACT TGA TG-3′ (előre) és az 5′-CTG CAC TAT TAT CAC AGT AGA TGG-3′ (hátra) a 3′ LTR. Az erősített termékeket Sanger szekvenálásra küldték Genewizben (South Plainfield, New Jersey). Genom-összeállításunk tartalmazza a beillesztés teljes példányát (~11,7 kb). A BLASTOT arra használták, hogy a beillesztést önmagához igazítsák annak érdekében, hogy azonosítsák a megfelelő hosszú terminál ismétlési régiókat. Az LTRDIGEST71 programot használták a robbanás eredményeinek megerősítésére. A robbanás keresés lekérdezte a teljes Ibn Majid szekvenciát a datolyapálma genomjával szemben, hogy meghatározza a másolatszámot.

A 11. kiegészítő táblázat a VIR gén kézi annotációjának koordinátáit tartalmazza a BC4 férfi szerelvényben. Genotipizálás a Ibn Majid behelyezés VIR exon 3 dátum pálma fajták végeztük kézi ellenőrzés igazított olvasás átívelő beillesztési régió jbrowse72. Mivel a BC4 férfi Genom szerelvény a beillesztési allél (VIRIM, lásd ábra. 3), leképezett olvasás származó vad típusú (VIR+), vagy nem beillesztési allélok, puha nyírni az exon 3-beillesztési határ. A genotípusok azonosításához a lágy nyírású olvasás (VIR+ allél jelenlétének támogatása) vagy az exon 3-beillesztési határ (a VIRIM beillesztési allél jelenlétének támogatása) nélküli olvasmányok jelenlétét szereztük be. Megismételtük ezt az eljárást, ha megvizsgáljuk olvassa el nyomvonalakat mind az 5′ 3′ végén a behelyezés a BC4 férfi közgyűlés, a mintákat, ahol mind az 5′ 3′ genotípusok hozott megfelelő genotípusok megőrzött elemzésre. Tekintettel a gyümölcs színű fenotípusok iránti érdeklődésünkre, csak a női tenyereket genotipizáltuk.

az invertázok és deléciós polimorfizmusok jellemzése

a QTL cukorösszetételben lévő gének vizsgálata az LG 14-en (kiegészítő adatok 6) kezdetben három pozíciós jelöltet tárt fel—egy lúgos/semleges invertázt (chr14G0028200) és két szomszédos sejtfal invertázt (chr14G0022900 és chr14G0023100), amelyeket génmegjegyzési csővezetékünk jósolt. Ellenőriztük az invertáz lehetséges további, nem hitelesített másolatait ebben a régióban azáltal, hogy a három gén mindegyikére előre jelzett átiratokat igazítottunk ebbe a régióba a Splign átirata segítségével a genomikus igazítási eszközhez73. Ez visszanyert egy mínusz szál szekvenciát (amelyet CWINV2-nek nevezünk), szoros homológiával a cwinv1 és CWINV3 oldalirányú inverzekhez 2,489,373-2,485,592, de többszörös beillesztés/törlés a régiókban homológ a CDS exonok invertálására.

A törlési variáció elemzésének lefedettségi mélységét 500 bp nem átfedő tartályokban határozták meg a samtools bedcov74-rel (V. 1.9) Az alapértelmezett beállítások. A nyers mélységi értékeket minden egyes minta esetében önállóan normalizálták úgy, hogy az egyes tartályok nyers mélységét elosztották az LG összes tartályának medián nyers mélységével 14 a log2 transzformációt követve Virágok et al.75. A mintákat homozigóta törlésre és alternatív genotípusosztályokra genotipizálták a 40 kb-os törléshez a kiegészítő ábra kézi ellenőrzésével. 12. Homozigóta genotípusok az A / N-INV1 deléciójához (ábra. 4, Kiegészítő Ábra. 13) egy olyan küszöbérték beállításával hívták fel, amely megköveteli, hogy az 5 kb törlési régióban legalább egy 500 bp intervallum log2 normalizált mélysége kisebb legyen, mint -5. Jelenleg nem lehet megkülönböztetni a heterozigótákat a deléciós alléloktól a beillesztési homozigótáktól az újbóli szekvenálási adataink mérsékelt lefedettsége miatt.

invertáz enzimvizsgálat

az invertázvizsgálathoz két szacharózt és két redukáló cukorfajtát választottak. A kísérletet két napon végezték el, mind a négy fajtát egyetlen gyümölcs képviseli minden nap. A vizsgálatokat egy khalal-fázisú gyümölcsfagyasztáson végezték a gyűjtés időpontjában (lásd fent), majd -80 °C-on tárolták.A Hasegawa és Smolensky33 jegyzőkönyvét követően a fagyasztott dátumú gyümölcsből nyerték a nyers kivonatokat. Minden fagyasztott gyümölcsöt habarccsal és mozsárban porítottak (a vetőmagot eltávolították), majd egy konyhai turmixgépben őrölték, és 5 g-ot hideg extrakciós pufferbe (20 ml 4,0% NaCl, 1 g polivinilpirrolidon, PVP) helyeztek. További macerációs lépést végeztünk egy laboratóriumi homogenizátorral 1-2 percig. A kivonat volt, akkor centrifugált jelenleg 20 000 × g, 15 perc, 4 °C. A felülúszót tartalmazó oldható invertase tárolják, a jég, a maradék pedig a centrifugált második alkalommal jelenleg 20 000 × g, 15 perc, 4 °C. A supernatants egyesítjük, majd 10 ml dialyzed ellen, a hideg víz 4° egyik napról a másikra, hogy távolítsa el a cukorral, a kivonat. A mintát ezután kettéosztották, és a minta felét 100 °C-on felforralták, hogy megmérjék a gyümölcsből származó potenciális szennyező cukor háttéraktivitását. A fel nem forrázott és főtt nyers kivonatok invertáz aktivitását ezután kolorimetriás vizsgálattal mértük egy szinergikus H1 mikrolemez-olvasón egy kapcsolt enzimvizsgáló készlettel (Sigma katalógusszám. MAK118) a gyártó utasításait követve.

Gyümölcs RNS-Seq elemzés

Két RNS-Seq adathalmazok gyűjtése, hogy a cím kérdése a gyümölcs fejlődés, változás gyümölcs vonások. Az RNS-Seq különböző gyümölcsfejlesztési szakaszokban 2014-ben gyűjtött gyümölcsökön, az Egyesült Arab Emírségek Egyetemének, az Al-Ain-ban, az Egyesült Arab Emírségekben található Date Palm Tissue Culture Laboratory területén található replikált fákból. Ehhez a kísérlethez a Khenezi (vörös gyümölcsű fajta) és a Khalas (sárga gyümölcs) fajták három-négy különálló fáját ismételten mintavételezték 45, 75, 105, 120, és 135 nappal a beporzás után, valamint a folyékony nitrogénre fagyasztott gyümölcsöket. RNS kivont egyetlen gyümölcs minden három vagy több fa / különböző következő szabványos protokollokat TruSeq könyvtár készítmény, 2 × 101 bp párosított-end sorozatot végezni egy Illumina HiSeq 2500.

egy második kísérletet végeztek az Al-Shuwaib farmon 2016-ban összegyűjtött khalal színpadi gyümölcsökön. Három gyümölcsök gyűjtése az egyes nyolc tenyér minden más fajtát választotta alapján az, hogy vagy közel a szélsőségek, a szacharóz, illetve csökkenti a cukor típus disztribúciók (azaz, magas, illetve alacsony szacharóz koncentráció). A gyümölcsöket a fent leírtak szerint dolgozták fel, a könyvtárakat pedig a Nextera library preparation kit (Illumina) és a 2 × 76 bp páros végű szekvenálással készítették el egy NextSeq (Illumina) műszeren.

A differenciálexpressziós elemzést a nyers szekvenálás vágásával végezték Trimmomatic45 (v 0.36) paraméterekkel ILLUMINACLIP:〈adapter fasta〉:2:30:10 hátsó:3 vezető:3 SLIDINGWINDOW:4:15 MINLEN:36. Az olvasásokat ezután a BC4 férfi referencia genomjához igazították a csillag split read aligner47 (v. 2.5.3a) és read count generated per gene azáltal, hogy az Unió exons htseq-count76 (v. 0.9.1) állítva, hogy csak egyedileg leképezett olvas (azaz htseq-count options –type = exon–mode = union–nonunique = none). Read count normalization végeztünk a medián-of-arányok módszer DESeq277 (v. 1.8.2). Vizsgálatok a megkülönböztető kifejezés a Virescens (Pdac_HC_chr4G0137100) között piros (Khenezi, n = 3 párhuzamos könyvtárak), sárga (Khalas, n = 3, vagy 4 párhuzamos könyvtárak) fajták végeztek külön-külön a gyümölcs fejlesztési idő pontot, 45, 75, 105, 120, valamint a 135 nappal azt követően beporzás. A P-értékeket egy Wald-teszt szerint a Khenezi és a Khalas-kifejezés között minden szakaszban nincs különbség.

RNS-seq elemzése differenciál gén kifejeződése invertases A/N-INV1, CWINV1, valamint CWINV3 (Pdac_HC_chr14G0028200, Pdac_HC_chr14G0022900, valamint Pdac_HC_chr14G0023100-kal) között szacharóz (n = 4 fajták), valamint csökkenti a cukor típusú (n = 4 fajták) végezte épület három könyvtárak per különböző a kivont RNS függetlenül attól, három különböző gyümölcsök követi a sorozatot, hogy minden könyvtár. A szacharóz-típusú és redukáló-típusú fajták közötti differenciál expresszió elemzését ezután a csillagokkal való igazítással (lásd fent), a htseq-számmal történő számolással és a DESeq2-ben a nyers gróf mátrixok előállításával végezték. Raw számít génenként ezután össze az egész könyvtárak minden fajta miatt alacsony olvasási számít egyes könyvtárak. A későbbi analízist az első csepp alacsony számú gének (gének <10 olvasás összegezve mind a 8 Minta), majd a standard DESeq2 (v. 1.22.2) munkafolyamat négy biológiai ismétléssel (azaz, datolyapálma fajták) minden kezelési csoportban. A differenciál expresszió hipotézisének korrigálatlan P értékeit három jelölt gén fő szövegében mutatjuk be.

jelentési összefoglaló

a kutatástervezéssel kapcsolatos további információk az e cikkhez kapcsolódó Nature Research Reporting összefoglalóban találhatók.