关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

单核苷酸多态性(single nucleotide polymorphisms,SNPs)简介

2019.5.20

摘要
对单核苷酸多态性(single nucleotide polymorphisms,SNPs)的研究分析近几年被广泛应用于生物及医学研究的诸多领域,筛查SNPs的方法很多,各具特色,并一直不断地发展.本文对筛查SNP的几种常用及最新方法做一简要介绍,其中包括PCR-RFLP,分子信标等.细胞外基质的降解和改变是肿瘤转移的基本条件,基质金属蛋白酶(matrix metalloproteinases,MMPs)是一类依赖锌离子的蛋白水解酶,可以降解细胞外基质、基底膜、以及间质基质,在肿瘤转移中具有重要作用.有些MMP基因序列存在单基因多态性即SNP现象,且最终影响MMP蛋白的功能.对MMPs的单基因多态性研究为进一步从分子水平研究MMPs的结构和功能及MMPs与肿瘤转移的关系提供了一个新的方向.

关键词:肿瘤转移; SNPs; MMPs



0 引言
单核苷酸多态性(single nucleotide polymorphisms,SNPs)是第三代遗传诊断标记,近几年被广泛应用于生物以及医学研究的诸多领域,筛查SNP的方法自从1996年SNP被正式定为第三代遗传标记以来得到很大的发展,进一步促进了对SNP的研究.尤其是芯片技术的应用使SNP研究进入一个新的阶段.基质金属蛋白酶(matrix metalloproteinases,MMPs)在肿瘤转移中具有重要作用,对MMPs的研究可以揭示肿瘤转移的原因以及机制,有些MMP基因序列存在SNP现象,并与肿瘤转移有密切联系.研究MMPs的SNP为进一步从分子水平探讨MMPs的作用开辟了一条新的途径.

1 单基因多态性
单核苷酸多态性即SNPs是指基因组DNA序列中由于单个核苷酸(A,G,C,T)替换而引起的多态性,它是一种单核苷酸的变异,是继限制性酶切片断长度多态性即RFLP(restriction fragment length polymorphism)以及可变数***重复序列即VNTR(variable number of tandem repeat)和微卫星多态性(microsatellite polymorphism)之后的又一新一代多态性遗传标记,自从1994年第一次被提出之后,它渐渐成为与分子标记有关各领域研究的焦点[1-24].
作为第三代遗传标记,SNPs在基因组中具有高密度和高保守的特点,人类30亿个碱基中每千个碱基出现一次,初步估计在整个基因组共有300万以上的SNPs.大多数SNPs位于基因组的非编码区,并且有些位于基因组编码区的SNPs所致编码序列的改变并不影响翻译后的氨基酸序列,这种SNPs对个体的表现型是无影响的.但是有的SNPs位于基因启动子中,导致基因转录活性的上升或下降,造成该蛋白的表达量上升或下降,进一步影响其生物学活性.有些位于蛋白质编码区的SNPs可能影响翻译后关键的功能基团的氨基酸序列,从而影响蛋白质的功能,最终导致对特定环境或病因的反应敏感性.目前很多机构都在检测SNP,做SNP图,建立SNP与各种疾病之间的联系,如果得出某些SNP或某些SNP的特定组合与特定疾病、特定地区发病人群乃至个别患者有明显相关性,疾病的诊断和治疗将可以更有针对性,甚至做到个体化.近几年来,SNP筛查在遗传病的研究,药学的应用研究,以及肿瘤研究中都得到应用.

2 SNP的筛查方法
自从SNP受到重视以来,人们对SNP的筛查方法进行了许多探索和改进.传统的方法有单链构象多态性分析(single-strand conformation polymorphism,SSCP)[25-37]、[38-41]等.比较新兴的方法包括Taqman探针技术[42-50]、焦磷酸测序(pyrosequencing)[51-63]、DNA芯片(DNA chip)[64-73]分析、变性高效液相色谱(denaturing high performance liquid chromatography,DHPLC)[74-88]、能量转移标记的等位特异PCR[89]、基质辅助激光解吸附电离飞行时间质谱(matrix assisted laser desorption ionization time of flight mass spectrometry,MALDI-TOF)[72,90-113]等.下面仅介绍几种常用的SNP筛查方法.
2.1 PCR-RFLP方法[38-41] 利用限制性内切酶的酶切位点的特异性,用两种或两种以上的限制性内切酶作用于同一DNA片断,如果存在SNP位点,酶切片断的长度和数量则会出现差异,根据电泳的结果就可以判断是否有SNP位点以及出现的碱基替换的类型.该技术应用的前提是SNP的位点必须含有该限制内切酶的识别位点,它是SNP筛查中最经典的方法之一.
2.2 分子信标(molecular beacons)法[114-117] 分子信标 (molecular beacons)法由Tyagi et al[114]于1998年建立,作者构建了4种分子U型探针,其核苷酸序列除中央位点处分别为T、C、A、G外完全相同,探针的5′端分别用四种荧光物质标记:香豆素(coumarin,发蓝光)-T,荧光素(fluorescein,发绿光)-C,4甲基蕊香红(tetrame thylrhodamine,发桔红色光)-A,德州红(Texas red,发红光)-G,探针的3′端均结合4-[4′-二甲基胺基苯基氮]安息香酸(DABCYL,可淬灭很多荧光物质发出的荧光,可作为一种常用的淬灭物质),将这4种探针分别与四种模板链(中央位点处分别为A、G、T、C)互补配对结合.未结合时探针均不发荧光(通过荧光共振能量传递作用),只有探针与模板链完全互补配对时构象才会由U型变为直线型,从而发出大量荧光,即便只存在一个碱基的错配也不会发出荧光.可以通过荧光的颜色不同,识别出该位点的碱基种类.
2.3 Taqman荧光探针法[42-50] Taqman荧光探针法的原理是在PCR反应中,将一对荧光染料和荧光淬灭物质的染料对分别结合到Taqman探针的两端.探针未与目标序列结合时,通过荧光共振能量传递作用使荧光染料不发荧光;完全互补配对后,由于Taqman DNA聚合酶具有5′核酸酶活性,可将荧光染料从探针上切下来,其发出的荧光可用荧光计检测.如果探针与目标序列中存在错配碱基,就会减少探针与目标序列结合的紧密程度及Taqman DNA聚合酶切割荧光染料的活性,也就影响了荧光释放量,从而使碱基突变链与正常链得以区分.
2.4 DHPLC法[74-88] DHPLC即变性高效液相色谱技术是近年来新发展的一种SNP筛查方法,一种自动、快速、高通量的基因突变筛查技术,在与疾病相关的基因突变检测SNP筛查方面得到了推广应用.
其突变检测的基本原理是[6-9]:含有突变位点的PCR扩增产物经变性、逐步降温退火后,将形成同源和异源双链(即一条为突变链,另一条为正常链)两种DNA分子.在部分变性条件下,发生错配的异源双链DNA更易于解链为单链DNA,与DNAsep柱结合力降低,比同源双链DNA分子更易于被乙腈洗脱下来,从而与同源双链DNA分离.一般来说,含变异成分的PCR产物将在DHPLC图谱上比PCR非变异产物多1-2个峰型,因而两者可以被鉴别.
该方法有赖于DNA同源双链与异源双链之间物理性质的差异,根据异源双链和同源双链在变性反向高压液相离子柱层析过程中滞留时间不一致而分离.
2.5 PCR和测序结合法 将可能的SNP位点进行特异性PCR扩增,为了增加其特异性和准确性可采用巢式PCR,然后结合DNA测序(直接测序或克隆载体测序)找到SNP存在位点并确定其碱基替换类型.
该方法原理简单,容易掌握,适合对短基因片断的SNP筛查,因此,仍然被许多科研工作者应用,最新发表的科研文献中有很多是用该方法进行SNP筛查的.
2.6 PCR-MALDI-MS(PCR-matrix-assisted laser desorption ionization mass spectrometry)法[72,90-113] 生命科学的发展总是与分析技术的进步相关联,基质辅助激光解吸附电离(matrix assistant laser desorption ionization,MALDI)是由两位德国的科学家Franz Hillenkamp和Michael Karas于1988年发明的,并且因此获得了美国质谱协会(ASMS)1997年度杰出贡献奖.这种技术所具有的高灵敏度和高质量检测范围,使得能在pmol(10-12)乃至fmol(10-15)水平检测分子量高达几十万的生物大分子,从而开拓了质谱学一个崭新的领域——生物质谱,促使质谱技术在生命科学领域获得广泛应用和发展.
其基本原理是将分析物分散在基质分子(尼古丁酸及其同系物)中并形成晶体.当用激光(337 nm的氮激光)照射晶体时,由于基质分子吸收辐照光能量,导致能量蓄积并迅速产热,从而使基质晶体升华,导致基质和分析物膨胀并进入气相.由于MALDI常与TOF连在一起,称为基质辅助激光解吸附飞行时间质谱仪(MALDI-TOF-MS),俗称飞行质谱.自发明以来,MALDI-TOF-MS常被应用于蛋白质序列分析,制作肽指纹图谱,测量化合物分子量等,在基因领域的研究有DNA序列测定、DNA点突变、遗传病诊断等.在SNP筛查中,PCR和质谱技术结合,具有精确,灵敏,高通量的特点.
该方法的缺点是受仪器的限制,费用较高,质谱操作前的纯化技术要求高,否则容易引起误差.
2.7 基因芯片(DNA chip)[64-73] 基因芯片又称DNA芯片(DNA chip),DNA微集阵列(DNA microarray)等,指采用寡核苷酸原位合成或显微打印手段将大量的DNA片段有序地固定排列在固相支持物如尼龙膜,玻片等表面形成探针阵列,然后与标记的样品进行杂交,通过对杂交信号的检测实现快速、高效、并行的多态信息分析.利用基因芯片技术筛查SNP是随着近几年芯片技术的快速发展、应用、普及而建立的一种高度并行性、高通量、微型化和自动化的检测手段,应用该方法可以寻找新的SNP位点,并实现SNP位点在基因组中的精确定位.
近几年来SNP的筛查方法取得了很大的进展,但大都以PCR方法为基础,结合电泳技术,或结合荧光、质谱、酶联免疫等方法.除了我们上述的几种方法外,还有以分子杂交为基础的寡核苷酸连接分析(oligonucleotide ligation assay,OLA)[118-121],等位基因特异性寡核苷酸探针杂交法(allele-specific oligonucleotide hybridization,ASO)[122-125],动态等位基因特异性杂交(dynamic allele-specific hybridization,DASH)[126-129]法,单个碱基延伸标记(single base extension-tag,SBE-Tag)[130]法等,各种方法的应用使检测SNP越来越快速,准确,并且高通量,极大地丰富了现有的SNP库,激发了科学家们寻找SNP的热情.

3 MMPs与肿瘤转移的关系
3.1 肿瘤转移 肿瘤转移是制约临床治疗效果的一种恶性生物学行为[131-136],是造成肿瘤患者死亡的主要原因.肿瘤转移包括一系列过程,必须多次穿透基底膜(basement membrane,BM),细胞外基质(extral cell matrix,ECM)等,其中细胞外基质的降解和改变是肿瘤转移和血管生成的基本条件,因为肿瘤细胞必须具备降解细胞外基质,基底膜,甚至间质基质的能力,才能向周围浸润,并向血管、淋巴管及远处转移.其中ECM和BM的降解需要多种基质降解酶即MMPs的协同参与才能完成,因此患者肿瘤组织中MMPs的含量和肿瘤的转移往往呈相关性.
3.2 基质金属蛋白酶 基质金属蛋白酶即MMPs是一类依赖锌离子的蛋白水解酶,迄今为止已经发现了26种.MMPs能够降解细胞外基质和基底膜,参与许多生理和病理过程,是肿瘤浸润转移过程中最重要的调控分子之一,涉及肿瘤浸润和转移,血管的生成,在肿瘤的发展中起关键作用.现已在多种人类肿瘤中检测到MMPs的存在,并显示与肿瘤浸润转移力呈正相关.如早期肝癌和甲状腺癌中有MMP-1的表达,在人类结肠癌中MMP-2,MMP-7和MMP-9均过量表达,在乳腺癌中,已检测到MMP-8,MMP-9和MMP-11并且有望作为肿瘤转移诊断标记.有实验表明,表达MMP-9的乳腺癌肿瘤的浸润和转移发生较早,预后差[137-162].
SNP作为近几年来兴起的第三代分子遗传标记,具有密度大,遗传性稳定的特点.MMPs家族部分成员的启动子已经测序,分子水平的调控研究,尤其是对其启动子SNP的研究已经展开并取得进展,本文的后半部分将对此做一阐述.总之,研究MMPs基因的SNP现象,为进一步从转录水平了解MMPs的作用机制提供了一个很好的方向.

4 MMPs中有关SNP的研究
4.1 MMP-1启动子中SNP研究现状 MMP-1是少数可以降解I型以及III型胶原的酶之一,I型和III型胶原是构成胞外基质的主要成分,与肿瘤细胞的侵袭有密切关系[163-165].MMP-1启动子在-1607存在一个SNP,分别为5’-GAT-3’(1G)和5’-GGAT-3’(2G).Walter et al[166]应用PCR-RFLP方法研究了31例黑色素瘤转移病例的MMP-1启动子序列-1607位点1G/2G多态性,发现在11 q22.23(MMP-1基因的所在位点)处的杂合性缺失(loss of heterogene,LOH)与2G基因型有关:在12例有LOH的黑色素瘤患者中,83%保留有2G基因型,17%保留有1G基因型.由此推测2G基因型与肿瘤的浸润和转移有关.
Zhu et al[167]应用PCR-RFLP方法研究MMP-1启动子-1607位点SNP现象发现,2G/2G基因型提高了MMP-1的转录活性,因此2G/2G个体更易患肺癌,尤其在吸烟个体中危险更高.研究还发现:2G/2G个体比1G/1G或1G/2G个体更易提早发展为肺癌.
Nishioka et al[168]利用PCR和测序结合法分析了23例子宫颈上皮肿瘤(cervical intraepithelial neoplasias, CIN)标本和86例子宫颈癌(cervical cancer)标本的MMP-1启动子-1607 SNP,并进行统计学分析,发现MMP-1启动子2G SNP和MMP-1的表达之间存在相关性,并和子宫颈癌的临床分期有关.这表明MMP-1启动子的2G SNP可能影响MMP-1基因的转录活性,进而影响子宫颈癌的侵袭和浸润活性.
但也许SNP的作用效果在不同人群中存在差异,据Ju et al[45]报道:用TaqMan法对韩国232例子宫颈癌患者血液和332例健康对照个体血液进行MMP-1启动子-1607位点SNP分析发现:2G频率在子宫颈癌患者中为66.1%,而在对照组中为68.2%,二者之间没有明显差异.因此,2G SNP既不导致韩国妇女对子宫颈癌易感,又不促进子宫颈癌的发展.
Matsumura et al[169]用PCR-RFLP法分析了215个胃癌患者和166个健康对照个体,发现二者1G/2G的比率接近,并且无论在肿瘤的侵袭程度,淋巴结转移,和临床分期上都无明显的差别.但另一方面,发现SNP和胃癌患者的组织分化和性别分布有着显著关联(P<0.05),由此可见,MMP-1的启动子中2G等位基因的存在并不会提高患胃癌的危险,但是可以对胃癌的分化产生影响.
Wyatt et al[170]利用PCR和测序结合法测定34例人类包皮成纤维细胞中MMP-1启动子1G/2G多态性和相应MMP-1蛋白表达水平之间的关系,结果表明2G SNP的存在并不会显著提高MMP-1蛋白的含量,但是会提高MMP-1基因对外界刺激因子(如细胞因子,生长因子)的敏感性.此外可以采用PCR和测序结合法发现新的SNP位点,如Jurajda et al[171]应用PCR和测序结合法发现了MMP-1启动子中一个新的SNP位点:159A/G,通过对该位点和已经发现的1607 1G/2G的连锁分析发现A等位基因常和-1607的2G等位基因连锁,而G等位基因则常和1G等位基因连锁,从而为以后研究MMP-1表达在肿瘤转移中的意义提供了一个新的方向.
另外,关于MMP-1在转录水平调控机制的研究也早已展开.研究表明MMP-1的表达受有丝分裂素激活蛋白激酶(mitogen-activated protein kinase,MAPK)途径的调控,MAPK途径由三部分组成,分别是胞外信号调控激酶(extracellular signal regulated kinase,ERK),p38和c-Jun N端激酶(c-Jun N-terminal kinase,JNK).它们都是以核转录因子家族活性蛋白-1(activated protein-1 AP-1)和ETS转录因子家族为底物的.MMP-1启动子-1607位点的2G SNP提供了一个ETS结合位点,和-1602位点的AP-1结合位点共同作用,促进MMP-1的转录,因此,2G SNP与1G SNP相比,MMP-1的转录活性提高[172,173].黑色素瘤细胞系A2058是一个2G纯合体,具有高水平的MMP-1组成型表达.Tower et al[172]利用Northern blotting,Western blotting,荧光素酶活性分析和PCR为基础的定点突变方法研究发现,如果加入一个针对ERK途径的特异性抑制剂PD098059,则MMP-1的表达受阻,由此可见ERK1/2途径主要以MMP-1的2G多态型为靶点,促进MMP-1基因的转录,从而提高相应肿瘤细胞的转移能力.Tower et al[174]再次用乳腺癌细胞MCF-7/ADR研究发现,AP-1位点在2G SNP存在的情况下可以提高MMP-1基因的转录活性,相反在1G SNP存在的情况下则抑制MMP-1基因的转录,从而抑制I型胶原的降解,最终降低了MCF-7/ADR细胞的侵袭能力.可见,2G SNP和ERK1/2途径以及AP-1位点共同协作促进MMP-1的高表达,最终导致乳腺癌细胞的侵袭能力提高.
同样Tower et al[175]发现FRA-1(Fos-like region antigen)和AP-1转录因子共同促进A2058中MMP-1蛋白的表达.抑制FRA-1,与1G SNP相比,会明显下调含2G SNP的MMP-1启动子的转录活性.
Zinzindohoue et al[176]研究了结肠癌患者的MMP-1启动子2G/2G基因型与患者存活率之间的关系发现,具有2G/2G基因型的各个临床分期患者和同期非2G/2G基因型患者相比较都具有显著较低的存活率,统计分析结果是:I期和II期,P<0.01;从I期到III期,P<0.001;总体,P<0.04.因此,经过临床阶段,年龄,以及化疗辅助各方面因素的校正后,2G SNP可以作为独立的诊断结肠癌不良预后的指标.而同时进行的MMP-3启动子SNP和结肠癌存活率相关性研究则表明,二者无显著相关性.
4.2 MMP-3中SNP研究现状 MMP-3可以降解层黏连蛋白和纤黏连蛋白,对肿瘤发生和肿瘤生长具有重要意义.MMP-3启动子-1171位点存在5A/6A的多态现象. Krippl et al[177]应用Taqman荧光标记法对500例已经组织确诊为乳腺癌的患者和500个健康对照个体做了MMP-3启动子的SNP研究,发现5A/5A、5A/6A、6A/6A三种基因型在患者和对照中的分布大致相似,其中患者分别为20.6%、51.8%、27.6%,而对照则分别为23.3%、47.3%、29.4%.但患者中基因型为5A/5A者和5A/6A或6A/6A相比有较高的淋巴结转移率,因此MMP-3启动子的5A/6A多态性不会影响个体对乳腺癌的易感性,但是会提高患者的癌细胞转移能力.
Zhang et al[178]用PCR-RFLP方法分析了中国北方417位患者,其中食道鳞细胞癌(esophageal squamous cell carcinoma,ESCC)234例,胃贲门腺癌(gastric cardiac adenocarcinoma,GCA)183例,以及350例健康对照个体的MMP-3启动子的5A/6A SNP,发现ESCC患者中SNP至少含一个5A等位基因的个体具有明显的淋巴转移倾向,而在GCA患者中却没有观察到,因此MMP-3的5A SNP和ESCC的肿瘤发展以及淋巴转移有关.
Fang et al[179]为了研究MMP-3启动子5A/6A SNP和基因易感性、非小细胞肺癌(non-small cell lung cancer, NSCLC)以及淋巴结转移之间的关系,利用PCR-RFLP方法分析了173例NSCLC患者和350例健康对照个体的MMP-3启动子SNP,结果是:6A/6A、5A/6A、5A/5A三种基因型在NSCLC患者中的比例分别是65.3%、30.6%、4.1%,在健康个体中的比例分别是67.7%、30.0%、2.3%,可见总体基因型在患者和对照之间并没有明显的差异.但是,5A SNP在吸烟的患者中比在健康吸烟者中更常见.还发现:5A/5A基因型的患者和6A/6A基因型患者相比,具有更大的淋巴结转移的危险.因此,MMP-3 5A等位基因可能与吸烟者中NSCLC的易感性有关,并且5A/5A基因型可能会提高NSCLC患者的淋巴转移.
4.3 MMP-7中的SNP研究现状 众多的研究表明,MMP-7与人的子宫内膜癌以及胃肠消化道癌的肿瘤转移有关.在MMP-7启动子-181有一个A/G SNP位点.Zhang et al[180]用PCR-RFLP方法分析了258例ESCC,201例GCA,243例NSCLC,以及350例健康个体的MMP-7启动子A/G SNP现象,发现A/G或G/G SNP明显提高对以上三种癌症的易感性,方差分析表明-181G和GCA以及NSCLC之间有显著相关性,因此MMP-7的-181A/G SNP可以作为GCA和NSCLC的基因易感标记物.
4.4 MMP-9中的SNP研究现状 MMP-9是IV型胶原酶,是可以降解ECM主要骨架蛋白IV型胶原的蛋白水解酶之一,已经成为近几年肿瘤研究的焦点,是极具吸引力的肿瘤治疗的靶标,已经针对它们设计了一些有希望的抗肿瘤药物.
MMP-9启动子-1562存在一个C/T SNP,影响基因的表达,Matsumura et al[181]应用PCR-RFLP方法分析了177例胃癌和224例健康个体的MMP-9启动子SNP,结果发现二者的基因型没有明显的差别,但是SNP和肿瘤侵袭、临床阶段、以及淋巴转移有明显的相关性(P<0.05),因此MMP-9启动子中T等位基因和胃癌的侵袭性有关.

5 展望
迄今为止,SNP的筛查技术和方法越来越简便,精确,高通量,SNP筛查水平的提高必将为肿瘤的发生、发展、恶化、转移等各阶段的作用机制提供一个更微观的研究方法和思路,现阶段对26种MMPs中的SNP筛查仅着力于其中的一部分,比如MMP-1、MMP-3、MMP-9,并且大都集中研究基因启动子的SNP现象,而对结构基因的SNP筛查和研究尚未见报道.可以预见,随着MMPs对肿瘤转移的作用机制在蛋白质结构水平的研究进展,将会揭示有关结构基因SNP影响MMPs蛋白功能基团的氨基酸序列,进而影响酶的活性,以及肿瘤转移程度等各方面的信息.另外,现阶段大多从研究MMPs在病理组和正常对照组之间是否有显著差异方面入手,今后可进一步深入研究MMPs的SNP与其他的肿瘤转移因子的相互作用.总之,相信随着研究的进展,随着基因芯片技术的应用以及对人类基因组的日新月异的深入了解,必将发现更多MMPs的SNPs,揭示更多SNPs与肿瘤转移的相关性,为相应肿瘤诊断,预后评估,抗肿瘤药物研究甚至基因诊断和基因治疗提供依据.

推荐
关闭