自上而下方法评定测量不确定度的简介(一)
测量不确定度
(measurement of uncertainty, 简称不确定度),是指根据所用到的信息, 表征赋予被测量量值分散性的非负参数[
1]。美国标准局的Eisenhart于1963年首次提出不确定度,
引起了学者们广泛重视及对不确定度评定方法的探索。为了指导和规范不确定度的评定方法,
1993年ISO等7个国际组织联合发表了不确定度评定方法的文件《测量不确定度的评定指南》[ 2](guide to the expression
of uncertainty in measurement, GUM),而欧洲化学分析中心 (EURACHEM)
于1995年发布指南文件《测量不确定度的量化》[ 3](quantifying uncertainty in analytical
measurement, QUAM),对化学领域不确定度的评定进行了详细介绍。这些文件讲述了测量过程中不确定度分量细化, 结果较精确,
但评定过程较为繁琐, 计算的工作量较大[ 4],而对常规化学实验室和医学实验室来说, 有些不确定度的分量不易确认或没有必要进一步细化。因此,
需要进一步完善GUM和QUAM介绍的评定方法。
一、自上而下评定不确定度方法的提出和应用过程
1995年英国皇家化学学会名下的分析方法委员会
(analytical methods committee, AMC)[ 5]提出自上而下 (Top-down)
评定方法。AMC认为对化学实验室来说不需要分析每个测量程序的细节, 可用统一的公式计算合成不确定度,
即μc=sε2+σrun2+σlab2+ub2,式中sε为不精密度、σrun为批间偏移、σlab为实验室偏移、ub为方法学偏移。1999年Maroto等[
6]认为在较高的计量学水平下实验室偏移和批间精密度是随机误差, 方法学偏移是系统误差。
此后越来越多的学者重视应用自上而下方法评定不确定度。2001年Kristiansen[
7]认为不确定度应包含来自采样、制造商校准品和其他形式的偏移以及不精密度, 并提出可应用来自方法确认数据、室内质量控制 (internal
quality control, IQC) 数据、室间质量评价 (external quality assessment, EQA)
数据。2002年linko等[ 8]应用Workbench软件评定血钙和血糖的不确定度, 认为IQC数据可用于不确定度的评定, 因统计学和计量学的限制EQA数据不宜用于不确定度的分析。
2003年的一场有关GUM是否适用于医学实验室的辩论[
9, 10],自上而下方法再次引起了人们的重视。2004年Patriarca等[ 11]以重复性和期间精密度评定不精密度, 结合有证参考物质
(certificated reference material, CRM) 、回收实验和EQA靶值分析偏移,
从而评定血铅不确定度。同年White等[ 12]代表澳大利亚临床生物化学委员会 (australasian association of
clinical biochemists, AACB) 提出至少需6个月的IQC数据评定不精密度, 当时北欧创新中心 (nordic
innovation center, Nordtest)[ 13]系统地提出了适用于环境实验室的自上而下评定不确定度指南,
明确提出了从不精密度和偏移2个方面评定不确定度。这种对不确定度分量的处理方式逐步被大多数学者和学术机构所接受。如2006年Dimech等[
14]应用IQC与EQA数据进行评定, 同年Eurolab[ 15,
16]发表的技术报告建议以实验室确认数据、IQC数据和EQA数据为评定对象。2008年White[ 17]以及比利时联邦食品链安全局
(federal agency for the safety of the food chain, FASFC)[
18]都采用类似的评定方法。2010年Westgard[ 19]认为自上而下方法是医学实验室评定不确定度的实用方法。2012年CLSI[
20]发表了适用于医学实验室的评定不确定度指南, 分别介绍了自上而下和自下而上2种评定方法。
2005年国内学者王治国等[ 21]首次介绍了自上而下评定不确定度的方法, 中国合格评定国家认可委员会 (china national accreditation service for conformity assessment, CNAS)[ 22]于2012年发表了以自上而下方法评定医学实验室不确定度的技术报告。
如何更准确地利用不精密度和偏移的数据评定不确定度, 下面将分别进一步阐述。
二、 不精密度的不确定度评定方法
不精密度的评定有以下几种方法:(1) 利用IQC数据计算期间不精密度[ 13, 18, 23];(2) 计算2个时间段的期间不精密度, 然后再合并[ 11];(3) 分别计算批内和批间不精密度, 再计算总不精密度[ 5, 21]。
方法
(1) 是目前临床实验室最常用的方法, 也是最方便的方法,
只要开展IQC的项目都可用此方法评定不精密度。一般建议用3个浓度的质控品进行精密度实验[ 11]。不同质控品的浓度水平最好与医学决定水平相一致,
可能时最好与评定偏移时所用的参考物质或相应标本的水平相近。因短时间内的IQC数据不能准确反映一些引起不精密度的因素,
如不同人员的操作、试剂批号的更换等, AACB推荐的标准提出精密度实验的时间至少为6个月, Patriarca推荐为16个月,
亦有作者仅有1个月或20 d, 不同作者间的差别特别大。究竟多长期间最合适, 我们的资料表明, 无论是一级、二级或三级医院,
其精密度10个月以上才较稳定。因此, 如果每年评定1次的话, 应用上一年全年的不精密度数据较为合适。如果实验室条件发生了重大变化,
如改变了测量系统或方法学, 则应重新进行评定, 可先采用1个月的不精密度数据, 作为暂定结果, 待6个月或1年后再进行评定。
方法 (2) 中, 如果在精密度评定期间使用了2个批号的质控品, 可计算平均变异系数(CV),推荐的平均CV计算公式为:
CV平均=∑mi (ni-1) ×CVi2∑mini-m[ 20]
式中n为每个批次对应的实验室数目,m为批次数。亦有文献用CV平均=(CV1+CV2)/2[ 24]的方法计算, 但目前已很少有人使用。一般实验室每月计算1次IQC数据的CV。如计算1年的CV,原则上应将1年的全部数据重新计算CV。
方法
(3) 通过合并批内精密度与批间精密度计算总不精密度, 也称实验室内不精密度[ 25],CLSI EP5-A2和CLSI
EP15-A2均用该法评定不精密度。是否需在精密度评定中包含有重复性精密度
(批内精密度),目前尚无定论。大部分作者认为只要评定期间精密度就可以了。其原因可能为:(1) 在实验室的常规测量中一般不进行重复测量,
计算批内精密度不能反映实际情况[ 15];(2) 较长期间的不精密度包含了批内精密度[ 26],如同时再计算批内精密度, 可高估不精密度。
杨志钊等[
27]在进行室内质量控制时, 将质控品重复测量2~3次, 通过计算方差的方法, 得到批内和批间不精密度后, 再计算总不精密度,
这样也有可能高估不精密度。一般认为此时可计算2~3次测量结果的均值,
用该均值计算CV。如果同一质控品在一批标本的分析前、分析中和分析后分别被测定, 应将该2~3次的测量结果分别单独作为一个批次进行计算,
而不是计算他们的批内不精密度或合并计算均值。