关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

真核生物基因组-2

2020.9.08

(二) 中度重复序列

中度重复序列是指在真核基因组中重复数十至数万次(<105)的重复序列。其复性速度快于单拷贝顺序,但慢于高度重复序列。少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。依据重复序列的长度,中度重复序列可分为两种类型。

1.短分散片段(short interspersed repeated segments,SINES) 重复序列的平均长度为300bp(一般<500bp),与平均长度为1000bp左右的单拷贝序列间隔排列,拷贝数可达10万左右。如Alu家族、Hinf家族等属于这种类型的中度重复序列。


Alu家族 是哺乳动物基因组中含量最丰富的一种中度重复顺序家族,约占人类基因组的3%~6%。Alu家族每个成员的长度约300bp,每个单位长度中有一个限制性内切酶Alu的切点(AG↓CT),Alu可将其切成两段,130bp和170bp,因而定名为Alu序列(或Alu家族)。Alu序列分散在基因组中,在间隔区DNA,内含子中都发现有Alu序列。

Alu序列具有种特异性,以人的Alu序列制备的探针只能用于检测人的基因组中的Alu序列,由于在大多数的含有人的DNA的克隆中都含有Alu序列,因此,可用以人的Alu序列制备的探针与克隆杂交来进行筛选。


2.长分散片段(long interspersed repeated segments,LINES) 重复序列的长度大于1000bp,平均长度为3500~5000bp,如KpnⅠ家族等。中度重复序列在基因组中所占比例在不同种属之间差异很大,在人类基因组中约为12%。中度重复序列大多不编码蛋白质。其功能可能类似于高度重复序列。有些中度重复序列则是编码蛋白质或rRNA的结构基因,如HLA基因、rRNA基因、tRNA基因、组蛋白基因、免疫球蛋白基因等。中度重复序列可存在于结构基因之间、基因簇之中,甚至存在于内含子内部等。中度重复序列一般具有种属特异性,因此在适当的情况下,可以应用它们作为探针以区分不同种属哺乳动物细胞来源的DNA。

KpnⅠ家族 是中度重复顺序中仅次于Alu家族的第二大家族,用限制性核酸内切酶KpnⅠ消化人类及其它灵长类动物的DNA,在电泳图谱上可以看到4个不同长度的片段,分别为1.2、1.5、1.8和1.9kb,在人类基因组中,KpnⅠ家族的拷贝数约为3000~4800个,约占基因组的1%。


(2)组蛋白基因 在各种生物体内重复的次数不一样,组蛋白基因没有一定的排列方式,组蛋白基因不含内含子,组蛋白基因序列都很相似,从而编码的组蛋白在结构上和功能上也极为相似,具有高的保守性。


(三)低度重复序列(单拷贝序列)

低度重复序列在单倍体基因组中只出现一次或数次,因而复性速度很慢。人基因组中,大约有 60%~65% 的序列属于这一类。低度重复序列中储存了巨大的遗传信息,编码各种不同功能的蛋白质。目前尚不清楚单拷贝基因的确切数字,在低度重复序列中只有一小部份用来编码各种蛋白质,其他部份的功能尚不清楚。

五、多基因家族与假基因

(一) 多基因家族

多基因家族(multigene family)是指由某一祖先基因经过重复和变异所产生的一组基因。多基因家族可分为两类:①基因家族成簇地分布在某一条染色体上,其可同时发挥作用,合成某些蛋白质(如:组蛋白基因家族就成簇地集中在第7 q 32-6);②一个基因家族的不同成员成簇地分布在不同的染色体上,这些不同成员编码一组功能上紧密相关的蛋白质(如珠蛋白基因家族)。

(二) 假基因

在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(pseudo gene)。假基因与有功能的基因是同源的,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能的基因。

人们推测假基因的来源之一,可能是基因经过转录后生成的hnRNA通过剪接失去内含子形成mRNA,mRNA经逆转录产生cDNA,再整合到染色体DNA 中去,便有可能成为假基因,因此该假基因就没有内含子,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因失去表达活性。

六、多态性

基因组中某个基因在同种生物的不同个体中,同时和经常存在的两种或两种以上的变异型或基因型的现象,称为基因多态性(gene polymorphism)。

真核生物基因组中基因多态性常常出现在限制性核酸内切酶的酶切位点序列中,因此,用某个限制性核酸内切酶来酶解基因组的某段序列时,在同种的不同个体之间该段序列可能被酶解成长短不等的几个DNA片段,即这段序列在该种生物的群体中形成多态性,这种多态性称为限制性核酸内切酶片段长度多态性(restriction fragment length polymorphism,RFLP)。

RFLP分为两种类型:一类是由于限制性内切酶位点上发生了单个碱基突变而使这一限制性位点发生丢失或获得而产生的多态性,故称之为点多态性(point polymorphism)。这类多态性实际上是双态的,即有(+)或无(-)。另一类是由于DNA分子内部发生较大的顺序变化所致。这一类多态性又可以分成两个亚类:第一亚类是DNA顺序上发生突变如缺失、重复、插入。第二亚类是近几年发现的所谓“高变区”。高变区(highly variable region),是由多个串联重复顺序组成的,不同的个体高变区内所串联重复的拷贝数相差悬殊,因而高变区的长度变化很大,从而使高变区两侧限制性内切酶识别位点的固定位置随高变区的大小而发生相对位移。所以这一类型的RFLP是由于高变区内串联重复顺序的拷贝数不同所产生的,其突出特征是限制性内切酶识别位点本身的碱基没有发生改变,改变的只是它在基因组中的相对位置。


推荐
关闭