分析测试百科网 > 行业资讯 > 综述

基于影像学的多种人工智能算法在肿瘤研究中的应用进展

2019.3.22

　　人工智能（artificial intelligence，AI）即为研究、探索如何模拟人类智能并对人类智能进行扩展延伸的一门学科。现如今人工智能已成为人们广泛关注的焦点，其今后的发展将对各行各业产生深远的影响。机器学习（machine learning，ML）是实现人工智能的方法之一，是使计算机获得智能的途径，其包含多种类型算法体系，分类方法也多种多样。

　　按照算法模型结构的深度来划分，机器学习可以分为包含多隐层的深度学习及只含单隐层节点或无隐层节点的浅层学习，这两类算法各有其优势与局限。2006年Hinton等提出使用逐层贪婪预训练算法，解决了深度学习多隐层模型优化困难的问题，开启了深度学习发展的新纪元。

　　深度学习作为浅层学习的发展，有赖于近年来算法理论的突破、数据样本的扩增、以及强大的图像处理硬件设备。促进深度学习发展的条件同样也是约束深度学习算法临床应用的限制，如小样本疾病导致训练数据不足、医院图像处理设备落后无法满足深度学习算法的大规模运算、构建复杂的深度学习模型的难度以及大量的训练时间等。深度学习在特征提取方面与浅层学习主要的不同是其可从数据中直接提取高级特征，而浅层学习应用的特征则需要专家认定并人工编码为一种类型的数据。

　　对于临床应用而言，不同疾病数据量不同，诊断疾病的有效特征也不同，因此这两种类型的算法皆有各自对应的临床应用价值。由于对数据的依赖性，大样本量的疾病深度学习算法表现更好，而小样本量的疾病浅层学习更有优势。且有些疾病下浅层学习已经达到了非常高的准确率，无需再使用依赖高成本的硬件且结构复杂的深度学习。

　　医学影像人工智能检测系统即为基于计算机视觉技术的数学模型，通过医学图像的原始像素来挖掘图像的有效特征，学习和模拟医生的诊断技术，是一个化整为零、认识特征、重新组合、完成判断的复杂过程。随着影像数据不断增长，以及患者对影像诊断精准度的追求不断增高的背景下，影像医生的工作量明显增大，亟需可以快速、精准诊断疾病的工具。因此，人工智能在医学图像上的应用将成为解决主要矛盾的关键。

　　1. 人工智能在中枢神经系统肿瘤中的应用

　　1.1 脑肿瘤识别和分割

　　脑肿瘤分割的目的就是识别肿瘤的位置以及肿瘤向外浸润的区域，即识别出肿瘤组织、坏死组织及周围水肿等。临床上，多由医生手动分割图像，操作过程复杂、专业要求高、且重复性差，这就迫切需要一个能够辅助医生完成分割、提高工作效率及准确率的算法。Soltaninejad等使用基于三维超体素的机器学习算法分别对2个临床数据库（样本量分别为11例和30例）的MR图像进行分析，Dice系数分别为0.84、0.89，准确性较高，研究中采用了传统MR序列如T1W、T2W、液体衰减反转恢复序列（fluid attenuated inversion recovery，FLAIR）等，作者未来将加入扩散张量成像（diffusion tensor image，DTI）序列并扩大研究样本以增加分割的准确性及临床应用的可行性。

　　除了脑原发肿瘤，还有关于识别脑转移瘤的研究，Sunwoo等使用基于颅脑MR图像的计算机辅助诊断系统来提升影像医生对脑转移瘤的诊断准确率，影像医生的诊断敏感性从77.6%提升至81.9%，而对每例患者的诊断时间从114.4 s减少至72.1 s。研究显示，相比经验丰富的影像医生来说，计算机辅助系统对提升经验不足的影像医生的诊断准确率及诊断效率有更显著的帮助。但该研究也存在缺陷，病灶未经病理学确诊一定是转移瘤，仅通过临床信息以及随访来判定该患者为转移瘤患者，且计算机只能单纯检出病灶，无法鉴别病灶是原发还是转移，未来有待进一步研究。

　　1.2 胶质瘤分级

　　在识别和分割脑肿瘤的基础上，人工智能算法还可用于脑胶质瘤的分级。Yuehao等使用卷积神经网络对2014BRATS数据库的MR图像进行分析，其中3层结构的卷积神经网络在最佳界值的情况下敏感性与特异性皆为0.7333，但该研究样本仅有195例，而卷积神经网络属于深度学习算法，在训练时需要庞大的数据，且研究中低级别胶质瘤仅有25例，还需进一步扩大样本数量以及样本多样性来完善该研究。

　　Zhang等对比研究了25种不同机器学习算法对胶质瘤患者MR图像的分级表现，其中支持向量机算法获得了最高的准确率，当使用低级别与高级别分级标准时准确率达到0.945，而使用Ⅰ～Ⅳ级分级标准时准确率可达0.961，该研究的分级准确率已令人满意，未来有希望应用于临床，但该研究并未包含深度学习算法，若将浅层学习算法与深度学习算法进行对比，该研究将会更加完善和可靠。以上这两个研究分别用深度学习与浅层学习进行分级，类似这种样本数量较小的疾病，浅层学习具有更好的优势。

　　1.3 鉴别胶质瘤复发与治疗后坏死

　　胶质瘤的常规治疗手段为手术以及放化疗，而治疗后通常会导致组织坏死，坏死的组织在MR图像上与肿瘤复发有着极为相似的表现，都表现为T2W和FLAIR高信号。准确鉴别复发与坏死可以为后续治疗提供有效的帮助。Hu等使用支持向量机对31例脑肿瘤切除术后放化疗的患者进行分析，诊断敏感性达89.91%，特异性达93.72%，ROC曲线下面积（the area under the ROC curve，AUC）达0.9439，但该研究中未获取病理学金标准结果，仅用影像随访来判断是复发还是坏死，尚有待后续研究继续证实该算法的有效性。

　　1.4 胶质瘤预后预测

　　研究预后是为了掌握疾病发生、发展及治疗过程的规律，以便掌握诊疗主动权，相比人为预测，人工智能结果更加客观。Emblem等用支持向量机来分析MR灌注成像所获得的相对脑血容量值（relative cerebral blood volume，rCBV）来预测患者的生存期，结果用6个月、1年、2年、3年生存期来表示，AUC为0.794～0.851，作者还准备在未来的研究中加入患者的临床信息及多序列MR图像来综合训练算法，以实现全面的预后评估。

　　Nie等做了更全面的研究，其用深度学习算法自动提取高级别胶质瘤患者多序列MR图像中的特征，包含对比增强T1WI、功能性磁共振成像（functional MRI，fMRI）、DTI，继而应用支持向量机来归类特征从而预测生存期，预测结果以22个月为短/长生存期的分界，准确率达89.9%，该研究还发现从fMRI和DTI中提取的特征相比T1WI与预后更相关。

　　1.5 判断胶质瘤分子生物学改变

　　不同类型的肿瘤有着不同的分子发病机理，即便同一病理类型的肿瘤其分子改变也不尽相同，准确地判断脑肿瘤的分子生物学状态能够有效预判分子靶向药物的疗效，从而实现个体化治疗。有研究表明，基因或分子生物学改变的胶质瘤拥有特征性的MR图像，因此可以利用人工智能算法来分析肿瘤的图像特征，进而判断肿瘤的分子生物学改变。Korfiatis等使用卷积神经网络分析胶质瘤MR图像来判断肿瘤的O6-甲基鸟嘌呤-DNA甲基转移酶（O6-methylguanine-DNA methyltransferase，MGMT，其能反映肿瘤对替莫唑胺的敏感性，并且与患者生存期密切相关）的甲基化状态，对照组织病理判断的MGMT甲基化状态，结果显示预测准确率达94.9%。

　　Akkus等同样采用卷积神经网络来判断低级别胶质瘤的1p/19q染色体缺失状态，有研究表明1p/19q染色体共同缺失与低级别胶质瘤患者的生存期及对化疗和放疗敏感程度密切相关，结果显示预测准确率为87.7%。脑胶质瘤的病理活检成本高，风险大，若能使用非侵入手段判断肿瘤的分子生物学改变，将对患者的治疗选择以及预后评估提供巨大的帮助。

　　2. 人工智能在肺癌中的应用

　　肺癌已经成为严重损害人类健康和生命的恶性肿瘤之一，早期检出可明显提高患者生存率。人工智能在肺癌检出以及分期应用中已表现出良好临床应用价值，Masood等使用深度学习算法对多个数据库的胸部CT图像进行分析，诊断的平均准确率达84.58%，对肺癌T1～T4分期的准确率达77.89%～90.14%。

　　Sun等将深度学习算法和传统的浅层学习算法进行了对比研究，数据来源于肺部图像数据库联盟（lung image database consortium，LIDC），共包含13668张胸部CT图像，结果显示深度学习的AUC可达0.899±0.018，浅层学习为0.848±0.026，但该研究剔除了直径小于3 mm的结节以及无结节的图像，造成假阳性率降低，临床中普查低剂量胸部CT的患者多数为无结节或小于3 mm的结节，未来还有待更全面的研究。深度学习往往需要大量的数据来进行训练才能达到满意的效果，而传统的浅层学习对小样本疾病更有优势，对于肺癌肺结节这类样本数据量大的疾病而言，充分训练的深度学习准确率更高，人工智能识别肺结节也是国内各公司主要投入研究的方向，有望最先应用于临床。

　　3. 人工智能在乳腺癌中的应用

　　3.1 乳腺癌的识别

　　我国乳腺癌发病率位居女性恶性肿瘤首位，已成为危害我国女性健康的重要因素之一。传统的乳腺X线摄影优势在于发现细小钙化，而对于影像医生来说，想要利用乳腺X线摄影做出精确诊断尤其是对那些不均质乳腺以及致密型乳腺的患者来说并非易事。Becker等使用深度学习算法对143例诊断为乳腺癌或交界性病变的患者进行了分析，AUC可达0.82，与影像医生（0.77～0.87）相差无几。人工智能还可用于乳腺MR图像的研究，Lu等通过对感兴趣区（region of interest，ROI）数据库进行分析，AUC高达0.9617，敏感性为91.19%，特异性为96.31%，可见人工智能在乳腺MR图像诊断方面表现更加优异，但乳腺MR检查成本较高、扫描较慢，并不适合于普查。

　　3.2 乳腺良、恶性病变分类

　　乳腺超声检查因其无电离辐射、操作简单、可重复性强，已成为乳腺的首选影像学检查方式，尤其适合致密型乳腺占比高的中国女性。Becker等应用深度学习算法对632例患者进行分类（550例良性，82例恶性），计算机分类良恶性的总耗时为3.7 s，AUC可达0.84；而3位经验由高到低的医生分别用时28 min、22 min、25 min，AUC为0.79～0.88，可见人工智能在乳腺癌良恶性分类上可以达到与影像医生相似的准确率，并且可显著提高工作效率。

　　4. 人工智能在肝脏肿瘤中的应用

　　4.1 寻找肝转移瘤的原发灶

　　一般寻找肝癌原发灶的方法是有创获取转移组织进行细胞学检查，检查癌细胞分子基因表达，或对多处可疑原发部位进行影像学筛查如乳腺、盆腔、腹腔等。不仅耗费大量资金与精力，且穿刺活检会对患者造成损伤并可能造成肿瘤进一步转移。Ben-Cohen等对71例患者（分别为乳腺癌、黑色素瘤、结直肠癌、胰腺癌）的肝转移瘤CT平扫及增强图像进行特征提取，这些特征包括人工测量特征如灰度值、形态、质地等，还包括卷积神经元网络所提取的特征，然后使用支持向量机对特征进行分类诊断，诊断结果为对所给4种原发灶进行依次排序，第1名为最有可能的原发灶，以此类推，排名第1诊断准确率达0.62，排名前2的诊断准确率达0.83（即前两名中有1个为真实原发灶），排名前3的诊断准确率达0.99（即前3名中有一个为真实原发灶），可见人工智能可以提示优先检查的部位，以节省大量检查成本。

　　4.2 预测肝癌栓塞术后的疗效

　　对于无法手术的终末期肝癌患者而言，肝动脉化疗栓塞术是首选的一种治疗方法。常规评估术后疗效的方法是通过增强CT或MR扫描评价肿瘤的大小变化，但想要通过影像数据预先判断患者经动脉栓塞是否会有疗效却富有挑战。Abajian等通过逻辑回归和随机森林算法模型分析术前MR图像以及临床信息来预估患者动脉栓塞的治疗结果，所得结论再同患者治疗一个月后的MR图像进行对比，预估准确率达到了78%，敏感性为62.5%，特异性为82.1%。人工智能预判疗效可对患者治疗方式的选择提出建设性意见，但该研究仅包含36例患者，样本量偏小。

　　5. 人工智能在前列腺癌中的应用

　　前列腺癌在西方国家常年位居男性恶性肿瘤发病率首位，近年来我国的发病率也呈现明显上升趋势。Wang等基于MR图像对比了深度学习算法与非深度学习算法在前列腺癌和良性增生的诊断准确率，深度学习的AUC可达0.83，非深度学习算法仅为0.70，可见深度学习用于鉴别二者表现更佳，但该研究将同一患者的多幅图像单独分析并认为这些图像互不相干，未来还有待设计出能将患者所有图像整合分析的算法。

　　6. 人工智能在骨肿瘤中的应用

　　骨是除肝脏、肺以外排名第3的肿瘤转移好发处，而脊柱又是骨转移的最常见好发处，脊柱转移瘤会造成患者生活质量明显下降，因此早期发现具有重要意义。Wang等使用深度学习算法对26例脊柱转移患者的脊柱矢状位MR图像进行分析，在合并了孪生神经元网络分析结果后，诊断敏感性达到了90%，但该研究尚需进一步研究扩大样本量。

　　总之，人工智能在肿瘤方面应用还主要集中在肿瘤识别、分割、良恶性判断、及预后分析等方面，在影像数据庞大的今天，影像医生肩负的工作量前所未有，若未来人工智能成功地应用到临床，就能辅助医生对病灶进行高效率的识别、分类、分割等。在图型处理器性能如此强大的今天，具备硬件条件的深度学习一度成为人们备受关注的宠儿，引领着人工智能迈入新时代的发展浪潮，但现阶段人工智能还属于初步的临床应用阶段，检出和预测效能以及临床应用流程均有待进一步探究；且当前人们所称的人工智能并非真正意义上的智能，当前的人工智能仅仅是利用大数据集来预测结果，预测的结果看似“智能”，但事实上它只不过是拥有前所未有的运算速度和数据规模的应用统计学模型而已。

　　医生的诊断总会带有自己的主观意愿，但人工智能也并非没有偏见的，由于机器学习的源泉数据，因而它们会复制并放大数据集中所带有的偏见。人工智能在医学图像上的应用同样存在这类问题，目前大多数机器学习的训练是基于国外有限的开放数据集或本医院一定时间段内的病例数据完成的，这些数据集并不能全面地反映该疾病的影像特征，不全面的数据集就容易导致偏见。相信在未来不断的发展与突破后，人工智能将会克服其现有的不足，为影像医生提供更有效的帮助。

肿瘤算法人工智能影像科

磁共振成像

喜欢作者我要约稿