关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

芥菜型油菜种皮转录组De Novo拼接及类黄酮生物...(一)

2020.6.22

芥菜型油菜作为一种广泛种植的作物,能产生不同颜色的种子。种子的着色是由于内皮细胞原花色素(proanthocyanidins,PA)的沉积,该终产物是通过一条类黄酮化合物合成的途径形成。为了进一步了解芥菜型油菜种子着色的基因信号网络,研究者采用Illumina/Solexa测序平台检测近交系黄籽种皮(SY)以及近等位基因系棕籽种皮(NILA)的转录组基因,对检测结果进行De Novo拼接,超过1.16亿个高质量的reads被组装成69,605个独立基因,其中以E value值为10-5为截点,大约71.5%(49,758个独立基因)能比对到Nr蛋白数据库。RPKM分析结果显示,棕籽种皮较黄籽种皮,有802个基因上调,502个基因下调。生物学通路分析显示,46个基因与类黄酮合成相关。在黄籽中,与后期类黄酮生物合成相关的编码基因二氢黄酮还原酶(DFR)、白花色素双加氧酶(LDOX)、花色素还原酶(ANR)不表达或者表达水平非常低,这也暗示了这些与PA合成相关的基因可能与芥菜型油菜种皮的着色相关,qRT-PCR检测进一步确认了该结果。

本研究是湖南农业大学油料作物研究所刘忠松教授课题组完成的。该研究首次实现芥菜型油菜种皮转录组测序,研究中所获得的基因不仅有利于阐明荠菜型油菜种皮着色的分子机制,且为该物种今后的基因组学研究提供了基础。研究中所涉及的Illumina HiSeq 2000测序服务以及数据分析服务由上海伯豪生物技术有限公司提供。

转录组测序及De Novo拼接:对SY以及NILA的转录组进行测序,在去除接头序列、低质量的序列等后,得到高质量的reads,结果见下表:

 


Figure 2 Overview of the Brassica juncea seed coat transcriptome assembly. (A) The size distribution of the scaffolds; (B) The size distribution of unigenes.

采用CLC Genomic Workbench 4.9软件,将高质量的reads进行拼接,获得99,096个contig,且每个contig的最小长度为200bp,通过pair-end连接以及缝隙拼接,产生了79,520个scaffold,平均每个scaffold长度为200bp。Figure 2A为scaffold分布图。采用CD-HIT (V.4.5.4)软件将scaffold进一步组装成69,605个独立基因,其分布图见Figure 2B。具体参数见表格。

功能注释:功能基因与NCBI的non redundant (Nr)蛋白数据库进行blast比对(以E value值10-5为截点),大约71.5%(49,758个独立基因)能比对到该数据库,它们中62.01%的基因E-value值低于1E-50且具有很好的同源性,剩余的37.99%的基因E-value值在1E-5与1E-50之间,见Figure 3A。相似度分析显示在能比对到Nr数据库的基因中50.06%的基因相似度超过90%,46.21%的基因相似度在60%-90%之间,仅仅有3.72%的基因相似度低于60%,见Figure 3B。种群分布图显示在能比对到Nr数据库的基因中接近96.49%的基因与6种热门物种相匹配:琴叶拟南芥(46.59%),鼠耳芥(40.59%),盐芥(3.37%),另外三种均属于十字花科,种群分布图中前20种的名称见Figure 3C。

 

 

Figure 3. Characteristics of homology search of Brassica juncea seed coat unigenes. (A) E-value distribution of the top Blastx hits against the non-redundant (Nr) protein database for each unigene; (B) Similarity distribution of the best Blastx hits for each unigene; (C) Number of unigenes matching the 20 top species using Blastx in the Nr database.

 

 

          Figure 4. GO classification of unigenes of B.juncea seed coat.

GO分类:依据序列的同源性进行GO分类,结果显示,在所有拼接出的基因中有19,618个基因可被归为37个功能组,其中最主要的三类(生物过程、细胞组成、分子功能)可以比分别比对到31,026, 22,918 以及 26,267个GO分类组,详见Figure 4。


推荐
热点排行
一周推荐
关闭