经典识别方法都是基于最小二乘估计,包括残差法、马氏距离、杠杆值和主成分得分图等。稳健识别方法则是通过寻找光谱矩阵稳健的均值和方差或者建立稳健的回归模型来寻找奇异样本。常用的方法包括椭球多变量修剪法、最小体积椭球估计、最小协方差行列式法、最小半球体积法和半数重采样法、M估计法等。基于统计学的识别方法则是通过重复地采样分析建模,然后通过统计参数来识别奇异样本, 常用的方法为蒙特卡洛交叉验证法。...
为了测量数据点之间的距离,建立了几个基于数学公式的优化模型,包括曼哈顿距离(L1)、欧几里得距离(L2)、皮尔逊相关系数等。距离度量的选择会影响HCA的性能,因此应谨慎决定。在HCA之前,应明确定义基本变量(生物标志物)、样本选择标准和研究目标,以便进行稳健和可重复的分析。此外,HCA可分为单向和双向HCA。...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号