关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

水稻HAK转运体基因家族的种系特异性扩张和适应性进化

2019.4.20

实验概要

高亲和力钾离子(high-affinity   K)转运体基因家族是植物中最大的钾离子转运基因家族,在植物的生长发育中起着重要的作用。本研究中通过全基因组搜索,在水稻基因组中发现27个基因编码高亲和力钾离子转运子。通过系统发生树将拟南芥与水稻的HAK转运子基因家族分成4个相互独立的亚族。在单子叶和双子叶植物分离之后,水稻中的HAK基因按照种系特异性的方式进行了扩张对该基因家族的功能性分歧分析表明该家族的亚族之间发生了功能性分歧现象。对该基因家族的适应性进化分析表明具有正选择效应的点突变和基因转换事件在该基因家族的进化过程中起到重要作用。

实验步骤

1. 基因组水平上水稻HAK转运体基因的鉴定

拟南芥中已经被确认存在13个拟南芥HAK转运子基因。本研究中从GenBank数据库中获得这13基因编码的蛋白质序列(见表)。为获取水稻的HAK基因,本研究首先利用Blastp搜索了TIGR水稻基因组注释数据库,水稻基因组计划(theRice  Genome  Project,RGP)数据库和NCBI数据库,对这些数据库的搜索利用的是拟南芥HAK转运体蛋白作为检索序列(见表)。如果检索出的蛋白质序列满足E≤10-10,将被作为候选序列。其次再利用Pfam软件鉴定所有的候选蛋白序列中是否存在K转运体结构域,若存在该结构域,将被作为HAK转运体。新鉴定出的HAK蛋白序列被作为检索序列重新进行上述操作,直至没有新的序列检出为止。水稻中HAK基因的核苷酸和蛋白质序列来自于TIGR数据库。利用这些基因的编码序列(CDS)为检索序列,通过Blastn检索Knowledge-Based  Oryza MolecularBiological Encylopedia数据库(KOME,  http://red.dna.affrc.go.jp/cDNA/),以获得这些基因的全长cDNA序列。同时利用水稻HAK基因的编码序列检索NCBI的EST数据库以获得与目标基因相匹配的EST序列。

2. 序列分析

   1) HAK转运体蛋白质序列的多序列联配利用Clustal X 1.83软件进行,参数为默认。将多序列联配结果输出至MEGA  4软件中,并利用MEGA 4构建系统发生树,方法为邻接法(neighbor-joining,NJ) 最小进化法(minimum  evolution,ME)和极大吝啬法(maximum  parsimony,MP),并利用bootstrpping法对构建的系统发生树进行评估。系统发生树的显示同样采用MEGA软件。

  2) 为评估该基因家族组间的功能性分歧,利用DIVERGE软件计算亚族间的I型功能性分歧系数e和似然比测验统计数。似然比测验统计数近似服从于1个自由度的卡方分布。显著高于0的e值表明在基因复制之后可变选择压力作用于一些氨基酸位点。

  3) 核苷酸的非同义替换率(dN)和同义替换率(dS)的比值(dN/dS)是衡量选择压力的分子进化参数,通常用ω表示。ω>  1表示正选择压力(positiveselection);ω < 1表示纯化选择压力(purifying  selection);而ω=1表示中性选择或自然选择压力(neutral selection)。本研究中利用PAML  4软件包中的codeml程序计算水稻每亚族HAK基因的ω。根据系统树和序列对位排列结果,采用“位点特异性”模型(site-specific  model)下的各种密码子替换模型来计算每个位点上的ω。似然比测验(LRT)可以用于比较嵌套间差异的显著性,前提是似然比的比较结果基本遵循卡方分布,其自由度为两个模型间自由参数之差。在本研究中采用M3(离散模型)对M0(单个ω)模型检验位点间是否存在选择压力的差异;并用M8对M7模型检验正选择压力。M7和M8模型均采用离散β分布来估计每个位点的ω值,并通过参数P和q来描述刀分布,M8和M7的不同之处在于M8添加了一类ω>1的位点,可用于检验正选择。若M8对M7的统计检验达到显著水平,并且M8模型具有ω>1,再通过贝叶斯方法估计经历正选择作用的位点。

  4) 组内基因间的序列交换检验采用Geneconv1.81程序,参数为默认。P<1表示具有统计意义的基因交换事件。

3. 水稻HAK基因的扩张模式分析

已有研究表明,大部分基因家族在植物中出现了成员数目扩张的现象。植物基因家族的扩张主要有三种模式,即串联重复、片段重复和逆转录转座及其他转座事件。本研究中对HAK基因家族的扩张主要考虑了片段重复和串联重复两种模式。首先,根据Gramene对水稻基因组的注释结果,将水稻所有的HAK基因定位在染色体上,将2个或2个以上紧密相邻的HAK基因定义为基因簇(cluster),即串联重复基因。为鉴定起源于片段重复的HAK基因,我们对Mather的方法进行了改进。首先我们在系统发生树上鉴定出水稻的旁系同源基因。其次我们分别查找到这一对旁系同源基因上游和下游各10个编码蛋白质的基因,该项是根据Gramme数据库的注释结果进行的。最后,通过Blast分析这一对旁系同源基因的上游和下游是否存在其他的旁系同源基因,若还存在其他的旁系同源基因,则表明这对HAK同源基因起源于片段重复事件。


推荐
关闭