分析测试百科网 > 行业资讯 > 焦点事件

研究提出个体差异测量信效度统计学框架

2019.7.03

　　作为人类特有的行为，科学研究是社会文明的重要推动力量之一。近年来，研究的可重复性问题成为科学关注的焦点，从心理科学到临床医学等领域，研究的可重复性成为巨大挑战。生命科学研究的共同特点之一是对于测量工具的需求，一项先进的技术会促进更为精准的测量，提升研究的可信度。测量理论中的信效度（可信度与有效度）概念在不同学科都有涉及，特别是在心理科学和医学中有明确的统计学界定，但在其他学科未被充分认识，尤其是交叉学科。

　　6月28日，中国科学院心理研究所研究员左西年与合作者在《自然-人类行为》上发表题为Harnessing reliability for neuroscience research 的评论文章，以神经科学为例，聚焦神经影像技术，提出了个体差异测量信效度统计学框架。在此框架下，个体差异的测量由三部分组成（图1）：研究对象（疾病或特质）特异的变化、研究对象非特异的变化、随机错误，其中前两者是个体间差异测量，随机错误则是个体内差异测量。个体差异测量的信度是个体间差异测量所占比例，而疾病或特质特异变化所占比例则是个体差异测量的效度。由此，测量的信度就像一个瓶子的盖子一样，牢牢地限制住了测量的效度，不可信的测量永远不可能有效；与此同时，测量的个体间差异越大，其信度越高，测量的个体内差异越小，其信度越高；最后，测量信度越高，其检测统计效应所需样本量越小。基于上述的三项测量信效度统计规律，加之效度无法直接测量，因此信度对个体差异的基础研究和应用转化至关重要。

　　近十年来，神经影像领域已经积累了大型数据集，成千上万的数据已经上线并公开，涵盖人类不同发展阶段和脑障碍。由此催生的开放式神经科学，推动了大型化脑科学（比如人工智能和脑疾病生物标记物）研究。个体差异研究的基础是统计力度，其决定了检测实验效应的能力。大样本量是提高统计力度的因素之一，然而如果测量信度不够，就会产生对大样本量的不必要需求。在此评论文章中，研究团队采用蒙特卡洛方法对信度、样本量和效应量之间的关系进行了数值模拟，结果揭示：在神经影像领域，潜在效应量较小，测量的信度局限将会极大地增加研究对样本量的需求（图2）。神经影像测量的信度研究表明：现有数据中极少有足够的个体数据能获得高度可信的脑连接测量。各国推出的各类大型脑计划中，个体差异的基础和转化研究（教育和临床）是中国脑计划的核心和特色，首要解决的基础科学问题是测量信效度，据此优化和标准化大型数据测量规范，防止产生大量的低质量数据样本。

　　神经影像领域的各类实验所采用测量的信度水平不一。以磁共振成像为例，脑形态测量最为可信，体素或区域信度可达到临床转化研究对信度的要求（大于0.8）；功能磁共振的测量则要低很多，并且依赖于扫描时间长短，其中认知任务功能磁共振测量因为实验设计直接来源于实验心理学领域的行为实验，个体间差异受到局限，导致其测量信度很低。从统计学的角度，低可信度的测量加上小样本将增加科学研究的假阳性率，降低了研究间的可重复性，这在基因组学已经被视为领域挑战并经长期研究来试图克服。反过来讲，高可信度测量的研究结果在科学期刊上出现得更为频繁，比如默认网络和额顶网络的测量可信度更高，因此就可能在各类研究中更易于被检测到，这种在各类脑疾病和个体差异研究出现的现象可能只是其测量信度高的一种表现，而并不是其实验效应特异性的体现。

　　该评论文章的主要目的是推动整个生命科学领域关注测量信度的评测与优化。特别是神经科学领域，通常对这一问题未给予足够重视，无论测量手段是影像、电生理、神经炎症标记物、微生物组学，还是认知神经科学范式、私人穿戴设备等，都应将测量信度及其决定因素作为基本问题来研究。为应对上述挑战，近十年来，心理所与国际合作团队一起，针对个体差异测量理论进行长期而系统的部署，重点培育“心理行为的个体差异及其毕生发展规律与应用”研究方向，领衔建立了“国际信度与可重复性联盟”，提出了大型脑智毕生发展项目“彩巢计划-成长在中国”，参与北京市脑计划，创建并主办双年度“国际人脑发展会议”，为参与和推动国家脑计划做出了具有国际影响力的贡献，更为详细的信度解决方案和未来研究方向请参见评论文章。

测量

生物谷

喜欢作者我要约稿

喜欢作者

打赏方式

研究提出个体差异测量信效度统计学框架

周锦帆