分析测试百科网 > 行业资讯 > 技术原理

医学实验室评定测量不确定度的争论和现状

2021.6.18

1、引言
从前面内容可知，目前在计量界测量不确定度的概念和理论己逐步取代“误差” 理论，表现在1995年由7个权威国际组织发布了测量不确定度的基础文件“Guide to Expression in Measurement,GUM”。我国政府在1999年据此公布了中华人民共和国计量技术规范“JJF1059-99测量不确定度评定与表示”。检验医学的最大国际组织“国际临床化学联合会（IFCC）”是7个国际组织之一，说明有相当一部分专家赞成和同意在医学实验室评定测量不确定度。ILAC在2006年成为第8个支持GUM的国际组织。因此ILAC在进行医学实验室认可时，要求对测量结果评定测量不确定度。客观上，社会和政府迫切要求医学实验室解决测量结果分散性或者不确定的问题。医学实验室不可能与理化实验室一样，对标本重复测量多次，取均值报告客户。医学实验室从成立开始，由于工作量大和成本上的考虑，除放射免疫测量外，绝大多数测量都只进行一次。这样，控制实验室内测量的分散性成为质量管理的重要问题。另一方面，随保健事业发展，医学实验室数量迅速增加。这样在医学实验室间测量结果的不一致成为更困扰的问题，并逐渐存为一个社会问题。中国医疗改革任务之一就是要求不同医学实验室的检验结果要一致，能在不同医疗机构间通用。为此，中国卫生部办公厅曾在2006年发布“关于医疗机构间医学检验、医学影像检查互认有关问题的通知”。文件中明确提出“?二、医疗机构间互认医学检验、医学影像检查，?具有重要意义。各级卫生行政部门和医疗机构要?积极探索并逐步推广开展医疗机构间检查互认的有效措施。?”。如何减小医学实验室测量结果的分散性已成为中国医学实验室质量管理核心任务之一，自然也成为医学实验室认可关注的重要问题。
历史上，医学实验室的专家们早在上世纪五、六十年代，就开始试图解决分散性问题，开始在医学实验室间小规模发送样本进行比对，发现差异很大，达到不仅医学界而且社会也很难容忍的程度。例如由于子宫颈涂片诊断错误引起美国国会在1967通过“临床实验室改进法案（CLIA 67）”。用法律促使临床实验室积极改进测量结果质量。其后，在医学实验室小规模室间比对基础上发展了现代化的能力比对（PT）计划。有名的美国临床病理学会(CAP)比对计划包括了全世界成万个医学实验室，又借用工业界控制产品质量的经验和办法，发展了室内质量控制（IQC）。不少国家以法律、法规形式要求每一个医学实验室必须进行室内质控（IQC），并参加室间质评（PT）计划。
在这些活动中，美国Westgard教授做出了卓越的贡献。他在1974年发表了“方法开发和评价中的判断精确度和准确度的标准”文章，首先用总分析误差来说明测量的质量或者分散性的大小。认为只要总分析误差小于特定量，任何类型的分析误差都是可被接受的。在随后三十余年间，Westgarfd在测量误差理论基础上，借用了统计学理论和方法发展了一个医学实验室质量管理的完整体系：首先他应用各种的实验方法,例如重复测定、回收、干扰和方法比对来评估随机和系统误差。基于观察到的误差与允许总误差之间的差异，可以判断测量方法的可接受性。并将这些概念扩展到室内质量控制（IQC），基于实验室发现分析误差的能力提出了著名的多规则质控规则。将IQC程序设计为可验证测量结果是否达到特定的以允许总误差为标志的质量水平，并用允许总误差评价PT的结果。例如不少PT计划以允许总误差来引导实验室达到声称的质量目标。为了确立每个检测的允许总误差，Westgard进行了大量工作，在其网站上可以查到一个有300-400个组的允许总误差数据库，并仍在不断增加和更新。
美国管理机构遵循以总误差为基础的Westgard质量管理体系进行大量管理工作。如在1992年, 美国的“临床实验室改进修正案(简称 CLIA 88)”确定了PT合格的性能标准，它实际上就是允许总误差。美国的临床和实验室标准研究院（CLSI）在2002年发布的“总分析误差的评定”导则，以及2006年发布的“室内质量控制导则”，都是基于检验的允许总误差和观察到的测量程序的不精确度和偏移来选择IQC规则和质控测量数。在2008年,美国的联邦食品和药品管理局（FDA）对厂家提供了“体外诊断仪器制造商的豁免申请”导则, 建议制造商建立允许总误差和误差删格（error grids）的标准，来表述和记录检验性能满足特定水平的质量。如同计量学是在与“ 误差” 争论中发展和确立“ 测量不确定度”。ILAC要求医学实验室评定测量不确定度必然会面对Westgard“总误差”理论体系的置疑。Westgard在今年发表了题为“医学实验室质量管理vs测量不确定度 ”的文章。对医学实验室评定测量不确定度提出不少的置疑，主要有以下二点：
医学实验室检测项目儿乎无或者很少有溯源性，缺乏有证参考物质（CRM）。这样无法按GUM/QUAM要求，对偏移进行纠正。要求按GUM/QUAM推荐办法，即从下而上，找出所有不确定度分量所耗费的资源和能力，对医学实验室是很困难的”。
Westgard在文章最后提出尖锐批评：“测量不确定度可能成为在实验室进行的没有意义的计算，把它展示给评审员，他再发证证明实验室进行了无意义参数的计算，以符合全球（ISO）标准，如果在原理和实践上，它们（ISO标准）都不正确的话，它就失去意义和价值”。
本节在阐明测量不确定度对医学实验室质量管理的贡献和作用的同时，简明地比较了二个体系的差异、各自的优点和不足之处；对Westgard提出的二点批评做出回应；在说明测量不确定度在保证测量结果的准确性，促使结果通用和互通性上的优点外。也将言及在评定测量不确定度上的困难和问题。
2 测量不确定度和溯源密切相关
GUM提出如下原则“任何结果都应该纠正已知的显著性偏移，并应附有一个测量不确度，给出一个包括了大部分变异值的，一定可信限的区间，而不是确定允许总误差”。Dybkaer教授在一篇题为“从允许总误差通过计量溯源到无偏移结果的测量不确定度”文章的结论中将测量不确定度和测量准确的关系说得非常明确“这些考虑的一个结局是应该是停止使用所谓‘结果的允许总误差’?代替的是要提供一个纠正的结果，并有一个明确的允许最大不确定度。同样，要求厂家确定测量系统期望不确定度。?最后，实验室工作者能向顾客提供一个有不确定度区间的纠正过的结果。”
Westgard对此批评为“ISO是想在全球范围内使测量成为可转移或可比较。这需要消除或纠正测量体系中的偏移或系统性误差，然后，按ISO报告任何检验结果中存在的变异（不确定度），并将质量通知给用户。这是一个良好的愿望。号召纠正已知偏移是计量学原则，但对医学实验室是有风险的，因为相对地只有很少的参考方法和（参考）物质。因此很难知道纠正的是否是正确的”。
从此段话不难看到Westgard无法否定GUM有关纠正偏移的重要原则和思想，只是认为在医学实验室不可能或很难溯源，从而认为偏移的存在是合理的。
如果说上世纪大部分检验专家对医学实验室测量结果能否准确持有与Westgard相同的观点。到21世纪，特别在2003年ISO颁布了ISO17511“校准品和质控物质的赋值和计量溯源”后，很多专家改变了看法，认为虽然目前医学实验室的所有检测程序，还不似理化实验室可溯源到溯源链最上层的参考体系，但己有相当一部分检测具有溯源性。按ISO 17511，如将医学实验室测量项目分为5类，前3类都有可能溯源到参考体系。换言之，通过校准和正确性验证计划可以查出偏移，并可按GUM原则，纠正显著的偏差。事实上Westgard也不否认此点，不然不会在其论文中提到：“本文认为总误差向实验室提供了一个实用、自上而下的办法来评估测量不确定，而ISO/GUM 模型应该指导并用于生产厂商”。
对ISO 17511的后2类，一类虽有参考物质，但不是用参考方法赋值，只有赋值方案，此类物质多用抗原抗体反应作为测量原理，由于抗原/抗体作用位点的差异，不同厂家分析系统的测量结果很难一致，谈不上可以得到公认的准确结果。后一类测量项目前尚无最上层的参考体系，也就是这类测量项目尚无参考方法、校准(参考)实验室和参考物质。这可能是ISO 15189对评定测量不确定度增加“适用且可能时”这个前提原因之一。对于这些无溯源性的，由于不存在准确性的标准，可能很难或按GUM原则对测量结果纠正，自然也不易评定测量不确定度。
Dybkaer教授用下列话反驳和批评了总误差理论：“允许总误差（实用还可称为‘允许偏差’）是为了特定类型的量和目的而设立的，可以在总量中自由地选择恒定性贡献和随机性贡献的分布，也可以包括已知的过程偏差。这是(美国)EQA的结果，当测量体系精确时，EQA结果会集中在方法学组分类中,而不考虑是否正确。
结果是, 不同测量程序的结果不能直接比较：
生物学的参考区间与测量程序相关,为了所有程序不得不扩大（参考区间）, 下降了诊断能力；
如果将结果与某一限值比较以区分生物学状态，就要碰运气；
不同类型量之间的公式无法在不同方法间通用；
病人在不同保健服务机构之间的变动，需要重复测量；
在保健和资源中，不能接受这种情况，可能导致抱怨和丧失商机”。
ILAC推行的医学实验室认可，在质量管理上遵循的是GUM原则。要求对测量结果进行溯源，如发现偏移应纠正后报告顾客，也就是无偏移的测量结果。人们应将精力集中在可以溯源并可纠正偏移的测量结果，计算它们的测量不确定度。这将促进检测结果的可比、和通用，是达到中国卫生部要求的“医疗机构间检查互认医学检验”，一条很好的途径。
反之，Westgard的质量管理体系中，由于认为医学实验室测量结果不能和很难溯源，很难得到准确结果。在总误差中容忍偏移存在。在这样质量管理理念下，很难达到医学实验室测量结果准确和通用。
3、医学实验室评定测量不确定度的特点
如将ISO 15189中评定测量不确定度的条款与ISO 17025的比较，可以发现对理化实验室的要求严于医学实验室。在ISO17025“5.4.6.1校准实验室或进行自校准的检测实验室，对所有的校准和各种校准类型都应具有并应用评定测量不确定度的程序”中，非常明确要求校准实验室应该评定测量不确定度。
又如“5.4.6.2检测实验室应具有并应用评定测量不确定度的程序。某些情况下，检测方法的性质会妨碍对测量不确定度进行严密的计量学和统计学上的有效计算。这种情况下，实验室至少应努力找出不确定度的所有分量且作出合理评定，并确保结果的表达方式不会对不确定度造成错觉。合理的评定应依据对方法性能的理解和测量范围，并利用诸如过去的经验和确认的数据”。对检测实验室要求应有评定测量不确定的程序。就是有困难，室验室也应努力找出不确定度的所有分量且作出合理评定，实际上是要求检测实验室应尽可能对测量结果评定测量不确定度。
并在5.4.6.3对如何评定测量不确定度作了如下规定：“在评定测量不确定度时，对给定条件下的所有重要不确定度分量，均应采用适当的分析方法加以考虑”。
从以上3个条款完全可以看出ISO 17025对评定测量不确定度的重视。
相比之下，在ISO 15189: 2007中只有下列一个条款，即：“5.6.2适用且可能时，实验室应确定检验结果的不确定度。应考虑所有重要的不确定度分量。不确定度来源可包括采样、样品制备、样品部分的选择、校准品、参考物质、输入量、所用设备、环境条件、样品状态和操作人员的变更”。
对医学实验室评定测量不确定度增加了一个“适用且可能时”的前提。说明对医学实验室是否要评定测量不确定度存在很大争论， Westgard对测量不确定度的强烈反对充分说明此项争论的剧烈。另外也可能与目前不少医学实验室的检测项目缺乏完善的溯源性有关。因此需要增加“适用且可能时”的前提。但是这前提也说明：已有相当一部分医学实验室的测量项目，例如生化和血液的大部分常规测量项目可以溯源，应该按GUM原则，对测量结果纠正并评定测量不确定度。但对那些溯源性不明确的测量项目，是否评定测量不确定度尚无结论。
在ISO 15189对如何评定测量不确定度作了“应考虑所有重要的不确定度分量” 描述，不同于ISO 17025使用了“所有分量”。能否暗示说医学实验室评定测量不确定度时可考虑偏移和不精密度两个重要不确定度分量？
从随后叙述还可看出，ISO 15189制定者认为计算不确定度时，应包括检测前过程的“采样、样品制备、样品部分的选择”分量。对这点遭到一些专家反对，如澳大利亚国家病理认可顾问委员会（NAPPC）在2009年颁布的“对评定测量不确定度的要求”文件认为只需评定测量过程，不需包括测量前过程的不确定度分量。
通过对ISO 17025和ISO 15189二文件中对评定测量不确定度不同要求的比较。可以看出医学实验室评定测量不确定度的保守和实际困难。