Articles

ナツメヤシの果実形質のゲノムワイド関連マッピング

BC4雄のゲノムシークエンシング

米国農務省(USDA)/カリフォルニア大学サーマル校リバーサイドファームにあるバッククロス雄ナツメヤシをサンプリングした(USDA accession No.1)。 PI5 5 5 4 1 5、ソースRIV7 5 4 5PL)。 このオスは、1970年代10月18日に中止された米国農務省の繁殖プログラムの一環として、バーヒー雌を再発親としてバッククロスする四世代によって生産された。 高分子量DNAの抽出および配列決定のために、arizona Genomics Institute(University o f Arizon,Tucson,A Z)に輸送する前に、小葉を洗浄し、液体窒素上で急凍結した。

BC4男性のゲノムは、PacBio RSIIシーケンシングプラットフォームを使用して配列決定されました。 配列決定のための高分子量DNAはマイナーな修正のDoyleおよびDoyle42の議定書を採用する若い葉から得られました。 PacBioライブラリの準備は、20kbのプロトコルに従っており、三つのライブラリ(20、25、および30kbでゲル選択)が構築されました。 約6.4百万の読み取りが生成され、合計72Gbのデータ(平均サブリード長11.2kb、N50 18.5kb)が生成された。 短い挿入ライブラリ(2×100bpペアエンド)の追加の配列決定は、Illumina HiSeq2500シーケンサを用いて行った。

Genome assembly

私たちは、アセンブリの目的のためにBC4男性ゲノムの生の短い読み取り配列からゲノムサイズのk-merベースの推定を行いました(Soapdenovo243のKmerfreq_Ar) P.dactyliferaの実験的ゲノムサイズ推定もフローサイトメトリー(下記参照)を用いて行われたことに注意してください。 その後、PacBio読み取りはFALCON-Unzip19(v.falcon)で組み立てられました-2017.06.28–18.01-7-ucs2)55×のシードカバレッジと入力として774Mbのk-merベースのゲノムサイズ推定値を持つ。 Unzipモジュールはデフォルト設定で実行されました。得られたアセンブリは、生のPacBio読み取りをQuiverおよびArrow(SMRT分析スイートv.2.3.0の一部)と整列させ、続いてPILON44v.1.18をBC4男性からのIllumina短い読み取りシーケ ピロンへの入力は、Trimmomatic45(v.0.32)で短い読み取りをトリミングすることによって生成され、3’q30の塩基品質以下の塩基を除去し、30ヌクレオチドよりも短 その後、読み取りはBowtie246(v.2.2.6)を使用してArrowの出力に整列されました。

研磨された一次連続体は、既存の遺伝的map21のLGSに固定され、ALLMAPS22は固定された一倍体アセンブリを生成した。 遺伝子マップの足場配列は、http://qatar-weill.cornell.edu/research/datepalmGenome/edition3/PdactyKAsm30_r20101206.fasta.gzから得た。 遺伝的マップに整列し、アセンブリへの生の読み取りの再配置の手動検査の後、我々は誤ったアセンブリの唯一のインスタンスを発見した:二つのコンティグの端が頭に頭にマージされたので、一つのコンティグが分割されなければならなかった。

ゲノムアノテーション

複数のkhalal段階の果実(下記参照)、雄と雌の花芽(以下”花”と呼ぶ)、花粉の混合物からRNA-Seqライブラリを生成し、Illumina HiSeq2500機器(補足表7)で2×100bp Leafおよびrootからの追加のナツメヤシRNA-Seqデータは、Sequence Read Archiveからダウンロードされた(補足表7)。 RNA-Seq読み取りは、Trimmomatic45でトリミングされ、star47(v.2.4.0.1)と一倍体アセンブリに整列され、Stringtie48によって予測される遺伝子モデル(v.1.3。2)Augustus49(v.2.3)のための訓練として使用されるため。

遺伝子注釈は、MAKER2pipeline50(v.2.31)を用いて行った。 相同性に基づく証拠には、7 0 9 7Est(2 0 1 7年2月9日のNCBI ESTデータベースからダウンロード)、Uniprot5 1由来のタンパク質配列、ナツメヤシプロテオーム、オイルパームプロテオーム5 2、およ A b initio予測は、Bowman e t a l.,2 0 0 2,1 9 9 8に記載されているように訓練されたAugustus(v.RNA−Seqアラインメントから、Stringtie4 8(v.

生のMAKER2注釈を解析し、Teドメインを含むモデルを除去し、Bowmanらに記載されているように転写またはPfamドメインの存在の証拠を欠いている。

53. 約1×の非オルガネラーシングルエンドWGS Illumina readsを用いて、De novo(non assembly−based)反復ライブラリをRepeatexplorer5 4で作製し、Copettiら(1 9 9 9)に記載のように解析した。55. アセンブリのリピートアノテーションは、RepeatMasker(v.4.0.6;ヌクレオチド空間で)およびBlaster56(REPET v2.5パッケージの一部、タンパク質空間で)で実行され、後で単一のアノテ 非コーディングRnaはInfernal57(v.1.1.2)とRfam library58(v.12.2)で予測されました。 1×10-5のe値しきい値を超えるヒットは、ファミリー固有の収集しきい値よりも低いスコアを持つ結果と同様に、除外されました。 両鎖上の遺伝子座を予測したとき,最高スコアのヒットのみが保たれた。 転送Rnaも、デフォルトパラメータを有するtRNAscan−SE5 9(v.

ゲノム品質評価

ゲノムアセンブリの視覚化は、assembly-statsソフトウェア(補足図)を使用して作成されました。

ゲノム品質評価

ゲノムアセンブリの視覚化 1, ). アセンブリの完全性は、1440植物オルソログ基(v.3)を使用してbusco20と遺伝子空間を特徴付けることによって、Blat60(v.350)と二倍体アセンブリにESTsを整列させる

ナツメヤシゲノムサイズ推定

ゲノムサイズは、Doleñel et al.わずかな変更を伴う61。 簡単に言えば、約1cm2の葉の材料は、二つのPから。 Royal Botanic Gardens,Kew,UKコレクションのdactylifera試料を、葉を軟化させるために3%PVP−4 0を添加した1mlの「汎用緩衝液」(GPB)6 2中で氷上で3 0秒間インキュベートした。 その後、校正標準Petroselinum crispumの葉材料の同様の量(ミル。)Fuss(1C値=2 2 0 1M B)6 3を添加し、結合された材料を、新しいかみそりの刃を使用して急速に(しかし、あまりにも激しくはない)細断した。 さらに1mlのGPB緩衝液を加え、次いでホモジネートを3 0μ Mナイロンメッシュ(Celltrics3 0μ Mメッシュ、Sysmex、Goritz、Germany)を通して管に濾過し、1 0 0μ lのヨウ化プロピジウム(1mg/mL)を加 5 0 0 0個の粒子の相対蛍光を、1 0 0mWの緑色固体レーザ(5 3 2nm,Cobolt Samba,Solna,Sweden)を装着したPartec Cyflow SL3フローサイトメータ(Partec Gmbh,Munster,Germany)を用いて記録した。 各葉の三つの複製を処理し、出力ヒストグラムは、FlowMaxソフトウェアv.2を使用して分析した。4(パルテック社)。 P.dactylifera(Mbp)の1C値は、(P.dactyliferaの平均ピーク位置/P.crispumの平均ピーク位置)×2 2 0 1Mb(=P.crispumの1C値)6 3として計算した。

GWASパネル

Gwasの表現型決定は、アラブ首長国連邦の二つの農場に位置するナツメヤシの木で行われました。 農場はハムリヤ、ラス*アル*ハイマ(n=46)とアル*シュワイブ、アル*アイン、アブダビ(n=111)のナツメヤシ研究センターに位置しています。 人口は主に女性の商業品種(n=145)で構成されています。 農場で成長している男性(n=12)も、主に性決定遺伝子座をマッピングする目的のために配列決定された。

Khalal stage果実サンプルは、2016年の春から秋にかけて収集され、RNAシークエンシングのために液体窒素上で凍結するか、写真撮影、スキャン(下記参照)、および他の果実形質の特性評価のために新鮮な果実として収集された。 2017年の夏には、同じ木のタマル段階の果実が砂糖と有機酸のプロファイリングのために収集されました。 葉のサンプルは、DNA抽出およびゲノム配列決定のために収集された。ゲノムDNAを、植物Dneasy mini kit(Qiagen,Venlo,Netherland)を用いて、葉または果実中果皮/果皮組織から抽出した。</p><p>ゲノムDNAを、葉または果実中果皮/果皮組織から抽出した。</p> DNA抽出カラム、およびIllumina Nextera(San Diego,C A)キットを使用して調製したライブラリー。 2×100bpペアエンドシーケンシングは、レーンごとに最大八つのライブラリを持つIllumina HiSeq2500シーケンサーで行われました。 読み取りは逆多重化され、Illumina品質管理フィルタを通過するものは、汚染アダプタシーケンスを除去するためにTrimmomatic45(v.0.36)で処理された。 アダプター除去のために、TRIMMOMATIC(v.0.32)ダウンロードに含まれているアダプターとNextera transposase sequence databaseを使用し、次の設定ILLUMINACLIP:〈adapter library〉:2:30:10MINLEN:76を使用して、両方の読み取りが76bps以上のトリ

読み取りは、bwa mem(v.0.7.15-r1140)を使用して、マスクされていないBC4男性アセンブリ(一次contigsのみ)に整列されました。 Bwa memアライナは、補足読み取り(0×800ビット単位のフラグ)をセカンダリ(0×100)としてマークするために-Mオプションを指定して実行されました。 サンプルの整列は、ペア読み取り情報の一貫性を確保するためにFixMateInformation(Picard-tools v.2.8.2;http://broadinstitute.github.io/picard)で処理され、整列を座標ソートするSamSort(Picard-tools v.2.8.2)、重複読み取りペアにフラグを設定するMarkDuplicates(Picard-tools v.2.8.2)、GATK64IndelRealignerTargetCreator/IndelRealignerツール(Gatk64IndelRealignerTargetCreator/IndelRealignerツール(Gatk64IndelRealignerTargetCreator/IndelRealignerツール(Gatk64IndelRealignerTargetCreator/IndelRealignerツール(Gatk64IndelRealignerTargetCreator/IndelRealignerツール(Gatk64IndelRealignerTargetCreator gatk v.3.7-0)は、indel領域で読み取りを再調整します。 サンプル整列は、ValidateSam(Picard-tools v.2.8.2)を使用して各ステップで検証され、生産にエラーがないことを確認しました。 処理された整列は、CollectAlignmentSummaryMetrics(Picard-tools v.2.8.2)およびSamtoolsで要約されました。

SNP calling and genotyping

SNP calling and genotypingは、GvcfモードでGATK(v.3.7-0)HaplotypeCallerを実行し、続いてGenotypeGVCFsとの共同genotypingを行った。 読み取りは、20未満のマッピング品質を有するものを除外し、ポリメラーゼ連鎖反応(PCR)重複または二次整列としてマークされたものを除外するためにHaplotypeCallerステッ このアプローチでは、すべてのサンプルで32,384,028Snpが得られました。 SNPフィルタリングは、GATK v.4.0.2.1を使用して生の変種にハードフィルタを適用することによって行われました。 サンプル間で合計された低(<>2862)のSnpを除外するために、生の呼び出しセットをフ また、マルチ対立遺伝子Snp、インデル多型の1 0bp以内のSnp、および以下の条件を満たすSnpを除外した:QUAL<div id=”d0 7 9 0f8 4 8 7”></div>3 0およびQD<div id=”D0 7 9 0f8 4 8 7”></div>5. 遺伝子型は、DPが5未満または2 0以上であった場合、ならびに遺伝子型コールレート<<80%、または0.01未満の小対立遺伝子頻度を有するSnp 我々は、Vcftools65を使用してHardy–Weinberg平衡試験から各部位のP値を推定し、ヘテロ接合性の過剰を示すSnpを除外した(正確なテスト、P<0.05)。 この手順では、7,149,205Snpのフィルター処理された呼び出しセットが生成されました。

統計分析

特に指示がない限り、すべての統計分析はR統計計算言語で行われました。

LD分析

ldは、位相のないデータに適したr2を推定する方法を使用して推定されました(Vcftools65を参照)。 GWASパネルのLD減衰曲線は、Flowers e t a l.4. 簡単に説明すると、VCFtools(v.0.1.14)の–geno-ldオプションを使用して、10%を超えるマイナー対立遺伝子頻度を有する非相同性Snpについてr2を計算した。 減衰曲線は、Marroniらから適応されたアプローチを用いて、非線形最小二乗を有するSNP対間の物理的距離による対r2推定値に曲線を当てはめることによっ66. 次いで、半減衰距離を、r2がその最大値の半分である距離(すなわち、1bp距離)として計算した。

果実の色の特性評価

ナツメヤシ品種ごとに傷害のない八khalal段階の果実を収穫し、水道水ですすぎ、ほこりを除去した後、空気乾燥した。 果実を縦方向にスライスし,果実の色を二つの戦略を用いて測定した。 まず、スライスした果物をカラーチェッカーでカメラフォトスタジオボックスで撮影し、デジタルカメラで白い背景で撮影しました。 果実の色は、RGB色パラメータを使用してImageJソフトウェア67で分析した。

第二に、我々は、色パラメータL*、a*、b*の推定値を得るためにトマトアナライザソフトウェア68v.2.2を使用した補完的なアプローチを使用しました。 L*座標は、色の暗さと明度を表し、黒(0)から白(100)の範囲です。 座標a*とb*は色の方向を表し、+a*は赤の方向、−a*は緑の方向、+b*は黄色の方向、−b*は青の方向を表します68。 画像取得および分析は、rodriguez e t a l.,2 0 0 2,1 9 9 9に記載のように行った。27. スライスされた果物は、黒の背景を持つスキャナ上に配置され、周囲光の影響を避けるために覆われていました。 スキャンした画像はJPEGファイルとして保存され、色パラメータL*、a*、b*の推定値は、各果実に行われました。 すべての果実の平均を計算した。 二つの方法は非常に相関していたので、我々は果物の肌の色の違いを評価するために色指数a*/b*を使用し、関連研究のためにそれを使用しました。

フルーツアントシアニン含量

総アントシアニンは、rabinoおよびMancinelli69に記載されている手順に従って、液体窒素上でスナップ凍結された果実を用いて、各ナツメヤシ品種からkhalal段階の果実の三つの複製から抽出された。 簡単に説明すると、凍結果実皮(1 0 0mg)からのアントシアニンを微粉末に粉砕し、1mlの酸性メタノール(1%Hcl)中で、暗所で室温で1 8時間インキュベーションし、続いて1 2,0 0 0gで1 0分間遠心分離することによって抽出した。 総アントシアニンの定量は、式を用いて分光光度計によって測定された吸光度を用いて行われた

総アントシアニン=(A530-0.25×A657)/FWここで、A530およびA657nmは吸光度であり、FWは植物材料の湿潤重量(g)である。

フルーツサイズ

色分析に使用されるフルーツ写真(上記参照)には、サイズ標準として定規が含まれていました。 Imagej67(v.2)とTomato analyzer software27は、果実の長さと幅を推定するために使用されました。

果実砂糖と酸content有量

果実ショ糖、グルコース、およびフルクトースは、果実が乾燥しているタマル段階で125品種から定量化され、熟成が完了し、日付が典型的に消費される段階である。 果実を-20℃でスナップ冷凍し、品種ごとに10-15個の果実をモンペリエ(フランス農業研究センター国際開発、CIRAD)に到着してすぐに-20℃に維持し、高速液体クロマトグラフィー分析を行った。 二つのプールされた果実からの単一の測定は、砂糖と酸の形質のそれぞれについて得られた。 日付片(石なし)を液体窒素で凍結し、粉末で粉砕し、二つの別々のタイトなガラスバイアルに入れ、サンプリングまで-20℃で保存した。 乾物については、重複して、1gのサンプルを秤量し、70℃の真空下で72時間ストーブに入れた。 糖抽出は、Bchir e t a l.,(1 9 9 9),bchir e t a l.70. 各試料について、500mgの日付ペーストおよび10mlの80%エタノールを15mlのチューブに入れ、水浴中で80℃で5分間加熱した。 その後、各チューブを最初に手動で攪拌し、次により良好な拡散のために15分間機械的に攪拌した。 9 0 0 0×g(Avanti J−E遠心分離機;Beckman−Coulter,Brea,C A,USA)での遠心分離の後、底部を2回抽出し、上清を集め、0. この方法を酸性水(0.01N H2SO4)で試験した。 Louis,MO,USA)を使用した。

フルーツ水分content有量

フルーツサンプリングは、上記のフルーツ砂糖と酸content有量のセクションのように行われました。 二つの果実からの日付パルプを回収し、液体窒素で粉砕して試料を均質化し、-80℃で保存して品種ごとの単一の測定を得た。 含水率は、サンプルが安定した重量に達するまで70℃で乾燥した日付パルプサンプルの2.5gの重量損失を測定することによって重量測定された。

ゲノムワイド関連解析

Gapit R package25を使用してゲノムワイド関連マッピング解析を実行しました。 計算効率のために、複数のテストの問題を最小限に抑えるが、LD減衰距離に関して密なカバレッジを提供するために、我々は5.5%ダウンサンプリングランダムSNPセット(392,948Snp)を使用した。 共変量として集団構造と親族情報の両方を使用してCMLM26は、157ナツメヤシサンプルからの遺伝子型に対して行われました。 集団構造は、Snpの1%(ランダムにサンプリング)を使用してGapitによって生成された主成分分析(PCA)を用いて推論された。 Gapitはさらに、PCAの最初の5つの構成要素を使用しました(図10)。 1a;補足データ2)。 親族関係はVanRadenアルゴリズムを使用して推定された(補足データ3)。 有意なSnpは、p<div id=“d0 7 9 0f8 4 8 7”></div>1.2 7×1 0−7の保守的なBonferroni閾値を用いて同定された。 有意な結果を有する形質について、本発明者らはさらに、有意なSnpが同定された特定のLg上の完全なSNPセットを使用して、第2のGWAS分析を行った。

Ibn MajidとVIR遺伝子の特性評価

我々は以前にR2R3-MYB転写factor13(NCBI遺伝子ID)のエクソン3におけるコピア様レトロトランスポゾン挿入多型を同定した: LOC103717680)それはオイルpalm28のVirescens(VIR)の遺伝子にorthologousです。 このレトロトランスポゾンを特徴付けるために、我々はGoTaq PCRコアシステム(Promega、マディソン、WI USA)緩衝液とポリメラーゼを使用して、それぞれ熱、カリフォルニア州とUSDA/UCプライマー対5’−TGT GTC CGG CAT TGC ACT TCT−3’(順方向)および5’−GCT C A A TGT TGA TGT TCT TGT TGG−3’(逆方向)を5’LTRに使用し、5’−ACTC TGA CTA CCA AGT ACT TGA TG−3’(順方向)および5’−CTG CAC TAT TAT CAC AGT AGA TGG−3’(逆方向)を3’LTRに使用した。 増幅された製品を送のためのガ配列でGeneWiz(南Plainfieldす). 私たちのゲノムアセンブリには、挿入の完全なコピー(〜11.7kb)も含まれています。 一致する長い末端反復領域を識別するために、挿入をそれ自体に対して整列させるためにBLASTを使用した。 BLAST結果を確認するために、プログラムLtrdigest7 1を使用した。 BLAST検索は、コピー数を決定するために、ナツメヤシゲノムに対して完全なIbn Majid配列を照会した。

補足表11は、BC4男性アセンブリにおけるVIR遺伝子の手動注釈の座標を提供します。 ナツメヤシ品種におけるVIRエクソン3におけるIbn Majid挿入のジェノタイピングは、Jbrowse72の挿入領域にまたがる整列リードの手動検査によって行われた。 以降、BC4男性ゲノムアセンブリの挿入遺伝子(VIRIMしたもの。 3)、野生型(VIR+)、または非挿入対立遺伝子に由来するマップされた読み取りは、エクソン3挿入境界でソフトクリッピングされます。 我々は、遺伝子型を識別するために(VIRIM挿入対立遺伝子の存在を支持する)エクソン3挿入境界にまたがるソフトクリップリード(VIR+対立遺伝子の存在を支 我々は、BC4男性アセンブリと5’と3’遺伝子型の両方が一致する遺伝子型が得られたサンプルの挿入の5’と3’末端の両方で読み取りアライメントを調 果実の色の表現型への関心を考えると、私たちは女性の手のひらのみを遺伝子型化しました。

インベルターゼと欠失多型の特性評価

lg14(補足データ6)上の糖組成QTL中の遺伝子の検査は、最初に三つの位置候補を明らかにした—アルカリ/中性インベルターゼ(chr14g0028200)と二つの隣接する細胞壁インベルターゼ(chr14g0022900とchr14g0023100)私たちの遺伝子アノテーションパイプラインによって予測される。 我々は、ゲノムアライメントtool73にSplign転写産物を使用して、この領域に三つの遺伝子のそれぞれの予測転写産物を整列させることにより、この領域にインベルターゼの潜在的な追加のunannotatedコピーをチェックしました。 これは、2,489,373 2,485,592に隣接するインベルターゼCWINV1とCWINV3に近い相同性で、マイナス鎖配列(我々はCWINV2と呼ぶ)が、インベルターゼCDSエクソンに相同な領域で複数の挿入/欠

削除変動分析のためのカバレッジ深さは、samtools bedcov74(v.1と500bpの非重複ビンで決定されました。9)デフォルト設定を使用して。 生の深さ値は、各ビンの生の深さを、FLOWSらのlog2変換後のlog1 4上のすべてのビンの中央値生の深さで割ることによって、各サンプルについて独立して正規化75. サンプルは、補足図の手動検査によって40kbの欠失のためのホモ接合欠失および代替の遺伝子型クラスに遺伝子型化された。 12. A/N−INV1の上流の欠失のためのホモ接合遺伝子型(図4)。 図4、補足図。 5kb欠失領域内の少なくとも1つの5 0 0bp間隔が、−5未満のlog2正規化深さを有することを必要とする閾値を設定することによって呼び出された。 現時点では、挿入ホモ接合体から削除対立遺伝子のヘテロ接合体を区別することはできません私たちの再配列決定データの中程度のカバレッジのた

インベルターゼ酵素アッセイ

二つのショ糖と二つの還元糖品種は、インベルターゼアッセイのために選択されました。 実験は二日に行われ、四つの品種はすべて一日に単一の果実で表された。 粗抽出物は、HasegawaおよびSmolensky3 3のプロトコールに従って、凍結日の果実から得られた。 各凍結果実を乳鉢および乳棒(種子を除去した状態で)で粉砕し、次いで、キッチンブレンダーで粉砕し、5gを冷抽出緩衝液(20ml4.0%NaCl、1g polyvinylpyrrolidone、PVP)に入れた。 追加の浸軟ステップは、1-2分間実験室ホモジナイザーで実施した。 次いで、抽出物を20,000×gで15分間4℃で遠心分離した。可溶性インベルターゼを含む上清を氷上に保存し、残りを20,000×gで15分間4℃で遠心分離した。上清を合わせ、10mlを冷水に対して4℃で一晩透析して、抽出物から糖を除去した。 次いで、試料を分割し、試料の半分を100℃で沸騰させて、果実からの潜在的な汚染糖からの背景活性を測定した。 次いで、未煮沸および煮沸した粗抽出物のインベルターゼ活性を、coupled enzyme assay kitを用いたSynergy H1microplate reader(Sigma catalog no. MAK118)製造業者の指示に従がって。

フルーツRNA-Seq解析

二つのRNA-Seqデータセットは、果物の発達と果物の形質の変化に関する質問に対処するために収集されました。 2014年にアラブ首長国連邦のアル-アインにあるアラブ首長国連邦大学のナツメヤシ組織培養研究所の敷地内にある複製木から採取した果実について、異なる果実開発段階でのRNA-Seqが行われた。 この実験のために、Khenezi(赤い果実を持つ品種)とKhalas(黄色の果実)品種の三つまたは四つの別々の木は、受粉後45、75、105、120、および135日で繰り返しサンプリングされ、果実 TRUSEQライブラリー調製のための標準プロトコルに従って、品種ごとに三つ以上の木から単一の果実からRNAを抽出し、2×101bp対端配列決定をIllumina HiSeq2500で行った。

2016年にAl-Shuwaib農場で採取されたkhalal段階の果実について、第二の実験が行われました。 しょ糖および還元糖タイプの分布(すなわち,しょ糖濃度の高および低)の極端またはそれに近いことに基づいて選択された異なる品種のそれぞれから三つの果実を収集した。 果実を上記のように処理し、Nextera library preparation kit(Illumina)および2×7 6bp対末端配列決定(paired−endd sequencing)をNextseq(Illumina)機器で行った。

差動発現解析は、パラメータILLUMINACLIP:≤adapter fasta≤:2:30:10TRAILING:3LEADING:3SLIDINGWINDOW:4:15MINLEN:36でtrimmomatic45(v0.36)で生のシーケンシング読み取りをトリミングすることによって行われました。 次に、読み取りは、星分割読み取りアライナー47(v.2.5。0.9.1)が一意にマップされた読み取りのみを含むように設定されたエクソンの和集合を取ることによって遺伝子ごとに生成された読み取り数(すな 読み取りカウントの正規化は、Deseq277(v.1.8.2)の比率の中央値法を用いて実施した。 赤(Khenezi、n=3複製ライブラリ)と黄色(Khalas、n=3または4複製ライブラリ)品種の間のVirescens(Pdac_Hc_Chr4G0137100)の差動発現のテストは、45、75、105、120、および135日後の受粉の果実開発時 各段階におけるKhenezi発現とKhalas発現との間に倍差がないという仮説のWaldの検定について、p値を報告する。

スクロース(n=4品種)と還元糖型(n=4品種)の間のインベルターゼA/N-INV1、CWINV1、およびCWINV3(Pdac_Hc_Chr14G0028200、Pdac_Hc_Chr14G0022900、およびPdac_Hc_Chr14G0023100、それぞれ)の差動遺伝子発現のRNA-seq解析は、抽出されたRNAから品種ごとに三つのライブラリを構築することによって行われた。独立して、各ライブラリを配列決定することに続いて三つの異なる果実から。 スクロース型と還元型の品種間の差動発現の分析は、その後、スター(上記参照)と読み取りを整列させ、htseqカウントで読み取りをカウントし、Deseq2で生のカウント行列を生成することによって行われました。 遺伝子あたりの生のカウントは、いくつかのライブラリで低い読み取りカウントのために、各品種のライブラ その後の分析は、最初に低カウント遺伝子(<10の遺伝子は、すべての8サンプルにわたって合計された読み取り)をドロップし、続いて標準Deseq2(v.1.22.2)、ナツメヤシ品種)各治療群で。 差動発現がないという仮説に対する修正されていないP値は、三つの候補遺伝子の本文に提示されている。

報告概要

研究デザインに関する詳細は、この記事にリンクされているNature Research Reporting Summaryを参照してください。