关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

实验室分析仪器--气相色谱质谱联用仪数数据处理方法

2022.1.27

气相色谱仪检测器输出的信号非常快速(可以视为连续信号),信号强度非常低(小至10+A),同时信号是模拟电信号,因此色谱仪输出电信号无法用简单的方法进行定性、定量处理,首先要把模拟电信号用记录仪记录下来或把模拟信号转换成数字信号储存下来,然后根据不同分析要求再做处理,以获得有关被分析组分的定性、定量结果或其他信息。气相色谱的数据记录处理方式一般可分为三种:台式记录仪、数据处理机和色谱工作站也是数据处理的不同发展阶段。


早期色谱数据的记录使用台式记录仪,采用差式电位计、同步电机、记录纸对模拟信号进行显示和记录,然后通过手动进行保留时间和峰面积的计算,由于操作烦琐,目前已完全被淘汰了。


色谱数据处理机是一种专门用于色谱数据分析的专用计算机,色谱处理机采用A/D转换器(模数转换器)将接收到的气相色谱检测器传过来的信号转换成数字信号存储到专用计算机中,分析人员可以通过键盘输入专用计算机指令来确定各种参数进行各种定量计算,进而打印出分析报告,但色谱谱图存储数量有限,结果也不是非常直观,制约了色谱数据处理机的推广和应用。


随着计算机技术的发展,色谱工作站已成为色谱数据处理的主流,其在组成和工作原理与数据处理机基本相同,但不同的是它是计算机程序,可在计算机操作系统下工作,存储和处理能力比数据处理机大得多,同时作为厂家专门配套的工作站,还可以实现气相色谱运行情况同步显示,并且具备气相色谱参数的实时控制。

本节将着重介绍滤噪和色谱峰检测等方法。


一、噪声平滑处理

色谱数据处理系统接收到的数字信号(经过模数转换的检测器信号),包含两部分信息部分是检测器对色谱柱流出物响应产生的电信号,另一部分是色谱系统(包括进样系统、分离系统、检测系统、放大系统和模数转换系统等)产生的一切与色谱流出物无关的信号,通常这类信号被称为“系统噪声”。系统噪声叠加在样品有关的真实信号之上,使色谱数据处理系统对色谱峰的检测判别以及进一步的数据处理带来了不利因素,所以有必要尽可能地将信号中含的噪声部分排除掉,以便更好地进行谱图数据处理。


应该注意的是谱图中的系统噪声与数据采集频率密切相关,同一条件下,噪声信号的大小正比于采集速率的1/2次方,随着采集频率的増加,噪声的大小也随之增加。因此适当降低数据采集频率可以降低原始谱图的噪声信号,为保证峰面积积分准确,每个完整色谱峰信号采集点数不应小于20,否则可能导致积分结果的偏差

系统噪声通常始终有高频的、杂乱的信号,去除系统噪声的方法一般为滤波或平滑。信号滤波技术可分为两大类,一类是硬件滤波技术,如RC电路滤波,另一类为软件滤波技术也称为数字滤波。硬件滤波器存在动态范围小、滤波效果不好、适应性差等问题。软件滤波是用计算机程序对数字信号进行平滑、滤波处理,通过预定的规则进行运算或变换,从而达到去除噪声的效果。软件滤波可以根据不同的实际情况,改变算法中的各种参数,来达到最佳的滤波效果。


软件数字滤波的应用广泛,使用方便,算法容易实现,越来越得到广泛的应用和重视。软件数字滤波方法常用的有均值滤波器、 Savitzky-Golay滤波器。

1.均值滤波器( mean filter)

均值滤波器也叫移动平均法,首先确定一个固定的时间窗口(n),窗口内数据(Y1)的平均值替换窗口中心的原始数据点,达到数据平滑的作用:

image.png

均值滤波器可以有效地压制信号抖动,尤其是脉冲式信号。通常采用的是三点中心或五点中心法,窗口设定越大,滤波效果越好,但谱图的畸变也越大。通常而言窗口设定应小于典型峰宽1/10,在此条件下,峰的畸变不是非常大,当窗口大于典型峰宽15,峰高会被明显变低,畸变严重,可能直接影响峰检測和积分。采用四点中心对称的移动平均法将会产生个“窗口”中心原先没有的数据点,可以提高峰谷点的判断精度。


2. Savitzky- Golay滤波器

Savitzky- Golay滤波器是1964年由 Savitzky和 Golay]提出的,根据其原理可称为移动窗口最小二乘多项式平滑,也称为最小二乘平滑,是分析化学中应用最广泛的平滑算法。Savitzky- Golay滤波或称 Savitzky- Golay平滑,利用中心点以及其前后m-1个数据点进行多项式的最小二乘拟合,定出多项式中的各项系数。然后,用多项式的值来代替实验值以达到数据平滑的目的。原则上说,选取的多项式次数越高,数据组内的点数越多,所计算出的数据平滑性也就越好,但在应用中还需将此法对实际峰形畸变的影响因素加以考虑。应用五点二次法平滑和七点三次法平滑处理较为理想。


五点二次法平滑:yi=(-3xi-2+12xi+17xi+12xi+1-3xi+2)/35


七点三次法平滑:yi=[7xi+6(xi+1+xi-1)+3(xi+2+xi-2)-2(xi+3+xi-3)]/21


其中,x是原始数据,y是经过平滑处理后的数据。从本质上说,移动窗口多项式平滑就是利用窗口内部各个点之间的加权来计算平滑后的新值。


在平滑滤波过程中,应该注意的是:对信号滤波,或多或少地会对有效信号产生影响,一般来说,随着信噪比的增加,峰形的畸变也会相应地增大,因此在选用各种滤波方法进行滤波时,应遵守这样一个原则:在峰形畸变保持在一定允许范围内,尽可能地提高信噪比。


色谱谱图的滤波一直是科学研究的热点问题,一些新的算法也被用于色请语图的平滑,其中快速傳里叶变换和小波变换被认为是理想的滤波算法,无论是傅里叶变换还是小波变换,其实质都是一样的,就是将信号在时间域和频率域之间相互转换,从看似复余的时间域的数据进行变换,将其转化分解成不同频率域的信号叠加,由于信号往往在频率域有比在时间域更加简单和直观的特性,根据色谱数据处理的经验,噪声的频率最高,色谱峰次之,基线的频率最低,将噪声所在的频率域的信号进行平滑,然后通过进一步反变换到时间域上,完成对请图的平滑,由于小波变换、傳里叶变换运算所需的数据量和运算量较大,在使用时一般不能直接完成,需要根据实际的噪声情况进行必要的调整,因此没有真正用于色谱工作站,但其良好的无歧视的滤波能力,尤其是针对微弱信号的获取可具有较理想的效果,使它成为数据处理研究的重点。


二、色谱峰的检測判别方法

峰检测的目标是判断色谱流出峰的起始点、最高点和结束点,它的准确性直接影响后续的定性、定量计算。随着计算机技术的发展,色谱数据处理机和工作站广泛应用于色谱的数据处理,基于软件的峰检测自动判定方法获得快速的发展,已产生了各种不同的色谱峰处理方法,如幅值法、统计门限法、面积灵敏度法与基线灵敏度法、一阶导数判别法、修正的一阶导数判别法、二阶导数判别法、增加斜率法等。


阶导数法是目前工作站中最为常用的色谱峰检测方法,主要是依据色谱峰信号的斜率变化(一阶导数)进行峰起点、落点和峰顶点的判别。色谱峰信号的一阶导数如图1所示,由图中可以看出在峰的起点处,其相应的一阶导数由零变成正,在峰顶点处,相应的一阶导数由正变成负,在峰结東处一阶导数由负变成零。

 Compress_1.jpg

图1  色谱峰及其相应的一阶导数示意图


通常情况下采样频率固定。为了计算方便,通常直接采用相邻信号的差值作为斜率,由于噪声的存在,基线处的一阶导数并不为零,而是在零点附近上下波动,所以,在一阶导数检测时须确定一个阈值。当信号增加,一阶导数值大于预定的阈值,确定峰的起点。当导数值由正变负时为峰顶点。当峰顶点确定后,若信号的一阶导数值的绝对值小于阈值时为峰的结東点。阈值可以根据基线中噪声偏差设定,通常设定值为基线噪声的3倍。

传统的一阶导数的缺陷在于对于对称峰形检测较为准确,但对于拖尾峰而言,由于值的存在可能导致峰结束点的判定提前。另一方面,对于那些峰宽较大的小峰可能会出现漏检的现象。为了改善信噪比较低的扁平峰的检测,1982年J.L. Excoffier等提出了修正一阶导数法用于色谱峰检测。对于相同峰高的色谱峰而言,峰越宽,一阶导数的值越小,由于值的限定,可能导致某些峰肉眼可见,但未获得检出。

由于噪声的影响,相邻信号差值的波动往往会大于色谱峰前沿的斜率,可能对判断造成影响。修正一阶导数法采用相隔几个点的差值来代替相邻两点的差作为斜率。在此情况下斜率的最大值随两点间距的增大而增大,当两点的距离为峰宽的一半时,数值达到最大振幅图2为同一谱图的一阶导数和修正一阶导数的结果,表明修正一阶导数明显优于一阶导数。

 Compress_2.jpg

 图2  色谱谱图的一阶导数和修正一阶导数比较

A-原始谱图;B-一阶导数;C-修正一阶导数

修正一阶导数的峰检測过程及判别依据与一阶导数法相同,同样需要根据噪声情况来确定峰判断的阈值,但从图9-2可以看出相同的基线噪声条件下,噪声对修正一阶导数干扰明显小于一阶导数,窗口越大干扰越小,其原理与采集频率-噪声相关性相同。


二阶导数也可用于色谱峰的判别,从实际应用效果而言,用二阶导数法的检测灵敏度要高于一阶导数法,甚至在基线出现线性漂移的情况下也不受影响。但基线噪声对信号导数的影响随导数阶数的增加而增大,会对程序上的峰判断产生不利影响,在实际工作站中较少使用。


E. F.G. Woerlee等提出增加斜率检素法(TS法),如图3所示。

Compress_3.jpg

图3 ITS法的起峰判断

将起始点(B1)固定,与其后连续四个信号点(B2、B3、B4、B3)分别计算其斜率值。当四个斜率值连续上升,则确定起始点(B1)为峰起点。这些关系可用下列公式表示:

 image.png

将上述关系式加以整理可转换为:

B3-2B2+B1>0&&2B4-3B3+B1>0&&3B5-4B4+B1>0

我们可以看出,实际上这种检测方法是二阶导数的一种变形。当数据点满足二阶导数检测法的条件时,也必能满足ITS法,相反,能满足ITS法的不一定能满足二阶导数法。ITS法对噪声的敏感性要低于二阶导数法,同时具有更高的检测灵敏度。


传统的一维气相色谱通常的峰容量比较低(通常小于1000现实样品中组分数则成千上万,其分离能力远不能满足使样本的峰获得完全的分离,通常的色谱处理系统一般对肩峰的情况不予考虑,将肩峰并入主峰进行计算。这种处理方法将给定量结果带来较大偏差。重叠峰分析也是色谱数据处理的研究重点,卢佩章教授等通过EMG模型进行全谱图曲线拟合的方法解决了重叠峰的定量问题이。但拟合法的色谱峰的模型参数以及色谱参数随保留时间的变化对拟合结果至关重要,而且运算复杂,同时缺乏质谱等其他信息进行轴助验证,难以实现广泛的使用,在通常的数据处理软件(工作站)中较少使用。然而,从实际的数据出发采用二阶导数可能实现重叠峰尤其是肩峰的拆分。图9-4为一后肩峰谱图及其一阶导数和二阶导数,理论上,后肩峰可根据以下条件进行判断:有后肩峰时,从主峰顶点到峰结東点,信号的一阶导数保持正号;而二阶导数出现了正负变换,由此可判断肩峰的存在。

Compress_5.jpg

图4 后肩峰的色谱图及其一阶导数和二阶导数


但如前文所述,信号的二阶导数对系统噪声十分敏感,直接采用上述方式进行判断容易出现错误。为了减小二阶导数的影响,可以采用查找一阶导数极值的方法进行肩峰判断,从图9.4中可以看出存在三个拐点,即一阶导数出现三个符号为负的极值点,两个极小、一个极大。为避免由于噪声的存在对肩峰判断的影响,当三个极值点找到后,极大值和极小值之间的差值需大于一个预先给定的门限值。此门限值根据噪声大小来确定,同时相邻极值点间的时间间隔也需满足一定条件,只有满足以上的系列条件才能确定出肩峰。


三、峰基线的确定

峰高是峰尖至峰底(或基线)的距离,峰面积是色谱峰与峰底(或基线)所围成的面积。峰高和峰面积是色谱定量的基本参数。前面论述了色谱峰的起点、终点的判定方法,只有色谐峰曲线与基线间的整个面积才表示该组分的总量,故峰面积的测量同时还取決于基线的判断。因此,要准确地测量峰高和峰面积,另一关键是基线的确定。

图9-5表示了不同情况下确定色谱基线的四种方法。

(1)水平基线校正法见图5(a),将始点水平画至最后一个色谱峰的始点,折上与该峰的终点相连的线,作为色谱的基线。此法用于基线基本平稳的情况。

(2)连带法或胶带法见图5(b),由第一个色谱峰的始点与最后一个色谱峰的终点连一直线,色谱基线则由低于此直线的各峰谷相连而成。此法适用于基线波动不大的情况(3)峰谷法见图5(c),把峰谷点之间的连线作为基线。此法适用于基线波动较大的情况。

(4)空白基线法见图5(d),是在不进样的情况下先作一次色谱分析,其谱图称为空白基线。然后在完全相同的色谱条件下进样分析,此时谱图与空白基线谱图相减,称为空白基线法。此方法主要用于程序升温等基线漂移较为严重的情况,对仪器的重复性要求很严否则会产生很大误差。

 Compress_6.jpg

 图5  确定色谱基线的几种方法

谱图基线必须根据色谱图的分离情况进行综合考虑。在使用微处理机和计算机时可以将色谱图调出,看谱图上基线的判断、峰的起落点和未分离峰的切割是否合理,若不合理,就必须重新设定参数,或通过手动的方式,再次处理数据直至满意为止。

 

两峰重合时,在数据处理中通常采用谷点作垂直线的方法进行切分。当谷点小于小峰的半峰高或者两峰等高时,误差不大。应当注意的是当谷点在小峰的半峰高以上时,小峰面积的测量误差会随大峰和小峰的峰高比值的增加而显著增加。Proksch等建立了气相色谱重合峰峰面积的校正系数表。通过重合峰的峰高比、分率等信息可在表中査到校正系数,用于面积折算。但其只有在峰形符合高斯分布、两个峰之间存在峰谷、小峰在大峰之前流出等条件下才适用。

 


推荐
关闭