关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

生命大数据──样本数字化多组学层次的生命健康大数据

2017.3.21

  2015 年初,奥巴马提出精准医学计划,意在大规模测定癌症病人的全基因组,获得大数据,挖掘癌症驱动基因,实现个性化精准用药,解决癌症对人类的威胁。2016 年初,拜登的癌症登月计划(Cancer Moonshot 2020)使精准医学计划正式落地。精准医学很快红遍全球,在世界各地、在国内也迅速催生出大量的聚焦精准医疗的创业公司。

  基因检测是目前癌症精准分型与精准用药的主要方法。但是,基因与生命活动的最终执行者——蛋白质之间仍然存在较大差异,难以直接反映生命变化。中心法则告诉我们,基因水平信息反映的是疾病发生的概率(即可能性),而蛋白质作为生命活动的最终执行者,其状态的改变更为直接地反映了疾病的发生、发展状况。相比于基因来说,蛋白质更适合作为一种动态指标,精准地发现与诊断疾病。因此,精准医学离不开蛋白质组学。

  标准化、规模化地记录样本中的所有信息,将临床样本转化为数字样本,构建数字样本库和疾病数据库

  香港歌手林子祥有次助阵“我是歌手”节目,唱过一首数字歌,大意是你的生日、你的身份ID、你的身家(存款)你的收入、你的体重、你的一切都可以用数字代表,很好玩。

  没错,生命是数字的,与计算机的 0 和 1 类似,ATCG 是生命的数字,数字化地存储与管理生命是未来的趋势。标准化、规模化地记录样本中的所有信息,将临床样本转化为数字样本,构建数字样本库和疾病数据库,可实现多组学层次的生命健康大数据。与基因组、转录组类似,蛋白质组样本数字化致力于将组织、体液、活检等临床样本转化为数字蛋白质组样本。

  基于 Orbitrap 的 DIA-MS 是最适合蛋白质组样本数字化的技术:重现性好、方法统一、定量准确度高,特别适合规模化、标准化的组织、体液、活检等临床样本的采集。

  1 数字化流程

  使用 iST、PCT 等方法实现大规模、自动化的临床样本前处理;使用经过优化的统一的 DIA 方法进行快速色谱分离与质谱采集(一般 ≤2 小时);使用 Spectronaut 等适合大数据处理的软件进行数据分析,获得定性、定量和统计分析结果。

  2 数字样本库:通过数字化流程将临床样本即刻转化为数字样本,记录样本中所有蛋白质信息,积累大数据。数字样本库避免了使用低温冰箱或液氮储存实物样本的高成本,并避免了样本长期储存造成的降解等变化,最大程度地反映了样本的初始状态。

  3 疾病知识库与数据库:对疾病数字样本库进行大数据分析与挖掘,实现疾病知识库与数据库的构建。基于大数据,能够更透彻地理解疾病,更精准地指导疾病诊断与个性化治疗。未来,看病或许就像谷歌和百度那样简单,采集病人的组学谱进行数据库检索,即可精确诊断疾病并个性化地制定治疗方案。

  苏黎世大学医院等诸多医学机构已经开始开展肿瘤人的组学谱相关蛋白质组样本数字化工作,通过数千至数万例癌症病人样本的收集和 DIA-MS 采集,构建数字样本库;通过大数据挖掘深层次的疾病特征,构建疾病数据库,为精准地癌症诊断、分型、治疗奠定基础。

推荐
热点排行
一周推荐
关闭