关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

使用SoftMax Pro 7软件选择最佳的曲线拟合方式(二)

2020.4.27

SSE 方法使用下面的公式进行分析:SSE= Σ wi (yi - yi)2。假设数据误差是不相关的且符合正态分布,使 SSE 尽可能的最小能够最大近似的估算数据模型的曲线公式参数。换句话说,最佳的曲线拟合方式是其参数能够得到最小的 SSE。如果两种拟合方式都能符合数据,那么哪个残差图给出了最小的 SSE,就使用那个拟合。

当两种拟合方式是嵌套关系及一种是另一种的特殊情况时,例如四参数拟合就是五参数拟合当 G = 1 时的特殊情况,具有更多参数的拟合方式要比另一个更能得到最小的 SSE。这是因为更多的参数能够使曲线拥有更多的拐点来匹配数据。因此,需要引入一些额外的统计计算来决定哪种拟合方式是最匹配数据的,这个统计计算有F-test 和 F-probability。F probability是使用 F-test 和拟合曲线模型的自由度来评估 SSE 的减小是否是偶然发生的。一般的,当 probability 值小于 0.05 时,说明该拟合曲线的公式最匹配数据。

AIC 方法是用类似的统计计算来比较两个具有嵌套关系的曲线拟合方式那个更匹配所给的数据。AIC 值能够通过下面的公式来计算,适用具有正态分布误差的数据:AIC = n* log (SSE/n) + 2K。这里 n 代表样本量,K 是描述曲线的参数数量。当样本量小时 (n /K < ~40),则使用二阶的AIC 值 (AICc),公式为 AICc = AIC + 2K*(K + 1) / (n - K - 1),这里 n 代表样本量,K是描述曲线的参数数量。当样本量增加时,AICc = AIC + 2K* (K + 1) / (n - K - 1) 公式末项值趋近于零,这时 AICc = AIC。AICc和 AIC 都用来评估最佳的拟合方式和公式拟合公式具有多少参数能够达到特定的匹配程度。AIC 方法限制了公式参数的数量,因此得到最佳的拟合方式却使参数最小化了。较低 AIC 值的曲线拟合通常是首选的拟合方式,即一个最少参数的曲线拟合公式依然能够是最佳的拟合方式。

上述两种方法都可以用来决定哪种曲线拟合方式最匹配数据,但是这两种方法均不能作为零假设检测的测试模型。如果很难找到最佳匹配的拟合方式,逻辑上选择最接近的拟合拟合。例如一个无限宇宙的模型,曲线拟合仅能够找到最佳参数的已知模型或者比较两个拟合方式哪个更好,但是适合无限宇宙模型的候选公式需要基于调查和科学的验证。在指定了一组合理的模型来解释数据之后,在分析之前需要评估全局模型的拟合应为最复杂的模型设置。假设全局模型匹配的话,那么认为简单模型也同样是匹配的,因为简单模型包含在全局模型中。

最佳拟合程度的衡量

SoftMax Pro7 能够使用一个新的独立的参数来衡量给的曲线是否匹配数据。参数依赖性是测量当一个参数到达最佳时另一个参数的最佳的限度和范围。一个具有 2 个或更多参数的拟合方式,描述曲线的参数即可能是关联性很强的,又可能是赘余的。如果在曲线拟合完成后改变曲线的一个参数,那么新的曲线应该是远离数据点的。在此时,如果改变另一个参数的值能够补偿固定参数并使曲线向数据点靠近,但是和原始曲线设置不同,那么这些参数是关联性。相反地,如果曲线回到了原始的位置,那么这些参数是赘余的。参数的独立性用 0~1 的数值进行衡量,当数值为1 时参数完全独立。要在图形中显示该独立性质时,请点击如图四的曲线拟合设置图标图四。将会弹出曲线拟合设置窗口,只要选择Statistics栏并勾选“Calculateparameter dependencies”即可。

在图形表格中将会显示出每一个参数的独立性质 ( 图五 )。在图五中,参数的独立程度使用对数标度的 bar 显示出来。十格bar 表明参数的独立程度很高。由于只有很小的值才会影响拟合结果,因此这种标度采用非线性的标度方式。如果多个参数bar 很小或没有的话,表明该拟合方式对数据是不匹配的。例如,如果数据是具有很明显上限和下限渐近线的 S 型曲线,那么一个四参数拟合将适用于该数据,所有参数应该都具有很高的 bar 值。但是如果一条或两条渐近线都没有的话,则参数 A和 D 的 bar 值将会很小,表明不能从数据中推导出可靠的参数值。

201861214332647.jpg

新的标准:曲线拟合评估

在 Softmax Pro 软件中设置了标准模板,曲线拟合评估,用来在分析数据时自动的计算SSE,F probability 和 AIC 值。在结果显示窗口中展示出使用 SSE 和 AIC 方法进行的曲线拟合分析相关的所有计算 ( 图七 )。标准模板均可以在 www.softmaxpro.com 网站中下载。在下面这个例子中,所要分析的数据使用四参数 ( 图 6A ) 和五参数 ( 图 6B ) 分别进行拟合,两种拟合方式均得到 R2 = 1。

201861214345804.jpg

所有的计算结果均在图七中罗列出来。SSE 方法显示五参数拟合比四参数拟合方式更匹配这些数据,因为五参数的 SSE =0.027 而四参数的 SSE = 0.058。问题是四参数拟合是五参数拟合的当 G = 1 时的特殊情况,四参数应该和五参数一样的适合于这类数据。因此需要使用额外的数据来进一步分析。F test (61.538) 和 F probability (0.000) 进一步确认了五参数拟合方式更匹配所分析的数据。AIC 方法也表明五参数拟合更适合所分析的数据,其中四参数 AIC = -405.365 而五参数 AIC =-447.945。最终残差图显示两种拟合方式都是数据点随机分布在 X 轴附近,说明两种拟合方式均适合于该数据 ( 图八 )。综合评估,所分析的数据最佳的拟合方式应选择五参数拟合。

2018612143418755.jpg

总结

在 SoftMax Pro7 中含有多种数学模型可供使用,包括常用的四参数和五参数拟合方式。R2 值可以粗略的衡量曲线拟合是否匹配所要分析的数据,特别是异方差类的数据。SSE 和 AIC 方法被用来评估曲线拟合的匹配程度已选择可能最好的曲线拟合方式。然而在此之前,首先要明确的是两种拟合数据的方式都必须是合理的和符合科学理性的。SoftMax Pro7 还包含一种方法,用来计算参数的独立性,以此评估曲线拟合方式对数据的匹配程度。参数独立性的结果能够直观的展示到图标中帮助你解读您的数据。


推荐
关闭