关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

人类究竟有多少个基因?研究结论再度更新

2018.9.05

  人类基因组的测序工作已经完成十五年了,不过人类到底有多少个基因,目前还存在争议。近日,西班牙国家癌症研究中心领导的一项新研究表明,多达20%的编码基因也许是非编码的,因为它们带有典型的非编码或假基因特征。

  这项成果发表在《Nucleic Acids Research》杂志上,将对生物医学研究产生重要影响,因为编码基因的数量及其鉴定对多种疾病的研究至关重要,包括癌症、心血管疾病等。Sanger研究所、麻省理工学院等机构的研究人员也参与了本研究。

  自从人类基因组测序完成后,全世界的专家一直在绘制人类蛋白质组的图谱,并确定产生蛋白质的基因。考虑到人类基因组的复杂程度,以及我们大概有20,000个不同的编码基因,这项任务相当繁重。

  研究人员分析了各个数据库中被归到蛋白质编码一类的基因。他们仔细比较了GENCODE/Ensembl、RefSeq和UniProtKB参考蛋白质组,发现了22,210个编码基因,但其中只有19,446个基因存在于三个数据库中。

  在分析那些仅存在于一个或两个数据库的2,764个基因时,他们惊讶地发现实验证据和人工注释表明,几乎所有这些基因都是非编码基因或假基因。事实上,这些基因及另外1,470个编码基因,不像典型的蛋白质编码基因那样进化。他们的结论是,这4,234个基因中的大多数可能不编码蛋白质。

  据科学家称,这项工作已经取得了成效。“我们已详细分析了许多基因,其中300个基因被重新归到非编码基因,”西班牙国家癌症研究中心的Michael Tress谈道。这些结果已经被GENCODE国际联盟纳入人类基因组的新注释。

  虽然最新的数据表明编码蛋白质的人类基因数量超过20,000个,但Sanger研究所的Federico Abascal认为:“我们的证据表明人类可能只含有19,000个编码基因,不过我们还不知道它们是哪些。”他也是这篇论文的第一作者。

  关于人类到底有多少个基因,目前还存在很大的不确定性,因为数量可能在20,000的基础上增加或减少2,000。尽管这是一项艰巨的任务,但人类参考蛋白质组对生物医学研究具有重要意义。


推荐
关闭