分析测试百科网 > 行业资讯 > 技术原理

使用SoftMax Pro 7软件选择最佳的曲线拟合方式（一）

2020.4.27

引言

当需要定义一个数据的特征时,如变化的比例、曲线上下边的渐近线或者 EC50/IC50值时，选择正确的曲线拟合方式是十分关键的。选择的曲线拟合方式应该是能够最准确的反映两个已知变量 (x,y) 的关系。因此，曲线拟合的目的就是为了寻找最佳的公式和参数来匹配数据。

SoftMax Pro 7软件能够提供 21 种曲线拟合方式，包括四参数 (4P) 和五参数 (5P) 非线性回归分析。多种的拟合方式选择，是为了确保能够找到适合数据的最佳拟合方式，并且能够通过调整所选拟合方式的参数来得到最能反映浓度响应变化关系的曲线图。

本文将介绍在 SoftMaxPro7 软件中能够运用的线性和非线性回归分析方法。另外，本文还给出了如何利用标准方差和阿凯克信息论准则来评估选择的拟合方式是否最合适。

优势

- 利用一种高效免洗实验方法来测定细胞活性
- 准确定量活细胞或死细胞
- 通过预设分析模块快速获得相关统计学结果

线性回归

线性回归拟合是最常见的数据拟合方式。它可以用下面的公式表示出来，y = A + Bx。其中x代表自变量 ( 一般是浓度等变量 ) ,y 代表因变量；B 值代表的是该公式对应直线的斜率，而 A 值则为 x = 0 时的 y 轴截距。SoftMax Pro提供三种线性拟合方式：y = A + Bx, semi-log y = A + B* log₁₀ (x), log-log log₁₀ (y) = A +B* log₁₀ (x)。软件可以通过数据分析中找到最佳的直线公式 ( 图表1 )。

在计算线性范围时，最小的标准品数据取点为 3 个，但是更多标准品数据能够提高拟合的准确性。这种拟合方式最大的优点就是计算简单。但是，大多数情况下，数据间的关系都是非线性的。

非线性回归

在测量值和变量为非线性关系时，通常使用logistic 回归分析。这种拟合方式的目的是为了找到最佳的公式参数来使公式计算的理论值和测量值之间的背离最小。为了能够正确地选择最佳的拟合方式，需要理解标准的曲线形状，并将他们与实际数据点的形状进行比较。

SoftMax Pro 软件提供了 17 种非线性曲线拟合方式。它包括：二次方拟合，三次方拟合，四次方拟合，log-logit，cubicspline，指数函数，直角双曲线，两参数指数函数，双指数函数，双直角双曲线，两点竞争，高斯拟合，Brain-Cousens，四参数拟合，五参数拟合和五参数交替拟合。SoftMax Pro 软件使用最广泛使用的迭代过程，Levenberg Marquardt 算法，来获得最佳的非线性拟合方式。四参数和五参数拟合是最常见的两种非线性曲线拟合方式，均适用于 S 形曲线的回归分析 ( 图2 )。

这类曲线拟合方式需求至少 4 个或 5 个数据点，使用 6 个以上的数据点能够获得更加准确的拟合公式。四参拟合表示为下列公式，y = ((A-D) / (1 + ((x/C)^B))) + D。其中 y 是相应值，D 值是无限分析物浓度下的响应值，A 是零分析物浓度下的响应值，x 是分析物浓度，C 是拐点值 (EC₅₀/IC₅₀)，B 是斜率参数。而响应的变化规律是：当A < D 时，y 值是正比于 x 值变化的；当 A> D 时，y 值是反比于 x 值变化的。四参数曲线是一个对称的曲线，曲线的一侧和另一侧以 EC₅₀/IC₅₀ 中心点完全点对称。而对于一些免疫实验或生物测试的数据,其数据图形并不对称，因此需要而外的变量来衡量该数据的复杂性。在这种情况下，五参数拟合方式能够通过引入一个新的参数 G ( 表二 ) 很好的反映出这类数据的特征。五参数拟合的通用公式为：y =((A-D) / (1 + ((x/C)^B)) ^G) + D。不对称参数 G 可以使曲线的两部分不一致。但是需要说明的是，当 G 值很小或者需要平行线(PLA) 分析时，建议使用四参数拟合方式来获得更好的拟合效果。

选择最佳的曲线拟合方式

曲线拟合后的好坏，尤其是标准曲线的建立，需要使用精准的数据来对其进行评估。重复实验设置对于获取好的曲线拟合是十分重要的，而单次实验随机性会使曲线拟合的效果很差。R² 值是用来评估曲线拟合好坏的一个很好的指标。通常来说，当 R² 值大于 0.99 时，曲线拟合效果被认为是很好的。但是当标准偏差随着样品的浓度变化而变化时，R² 值出现偏差而不准确。理想的情况是标准偏差在所有浓度样品下都应该一致，适用于方差一致性的数据；但是不是所有的情况都是标准偏差随着样品的浓度增加而增加，这时 R² 的就不适用了，需要新的方法衡量。

使用赤池信息量准则 (AIC) 和 F 分布下的统计量方法进行的误差平方和 (SSE) 被用来标准化这些异方差数据。这两种方法在衡量测定值和选择的拟合曲线的理论值之间的误差时是十分相似的方法。由于 SSE方法需要使用残差和残差图，因此该方法又称为残差平方和法。残差的定义是指在每个选定浓度下，实际的响应值y和所选拟合曲线所得的理论响应值 y′ 的差异性，即残差 = 测定数据-拟合数据 = y - y′。残差代表的是随机偏差。因此，当曲线拟合方式符合数据时，残差图中点的分布应该是围绕 y = 0 轴的随机点 ( 图表 3A )。如果残差图中点的分布情况是有规律的 ( 图表3B )，那么很明显该数据的曲线拟合方式是很差的。

互联网

喜欢作者我要约稿