激光诱导击穿光谱(LIBS)技术是一种新兴的元素检测和分析技术。当激光作用于样品表面时,在极短的时间内诱导产生含有样品物质信息的等离子体。通过对等离子体发出的光谱进行收集分析,建立光谱与元素一一对应的关系。由此可以检测出元素周期表中的大部分元素,检测限可达ppm级。通过标准物质定标后可以进一步得到元素的含量信息。
本研究采用5组国标土壤样品的光谱数据,通过对多种预处理方法的排列组合来探讨光谱预处理的必要性及预处理方法的选择。面向复杂基质样品的LIBS光谱预处理方法及定量精度优化策略。

我们通过5组国标土壤样品的实验得到元素的发射光谱。但是实验时可能因为种种原因导致光谱的质量不是很好。一方面可以调整激光参数、采样方式、脉冲次数、延迟时间等再次得到质量较好的光谱。有了较好质量的光谱是后期计算得到更好结果的前提。通常能够提高光谱质量的策略是:能量越大光谱信号越强;脉冲次数多,经过累加后可以得到更强的信号;对于基体效应强的样品,可以采用慢速画线法进行采样,可以有效避免单点多次重复采样带来的信号衰减问题;适当提前延迟时间可以有效采集到一些信号较弱的元素和一些等离子体寿命较短的元素信息;实验时通入氦气可以有效降噪、通入氩气可以达到增敏的作用;对于质地疏松的样品可按1:10的比例加入少量粘合剂进行压片。

另一方面,我们也需要后期对光谱数据进行一些必要预处理。元素含量的计算首先要进行标准曲线拟合。生态类样品,例如土壤、植物、中药材等属于基质较为复杂的样品。它们的光谱信号往往会受到杂散光、噪声、基线漂移等一些因素的干扰,从而影响最终的定量分析结果。因此通常需要在建模前对原始光谱进行预处理。目前已有的光谱预处理方法有很多种,如何选择合适的预处理方法就显得尤为重要了。常见的基线校正方法包括自动缩放、均值中心化、帕累托缩放等多种方法。光谱数据预处理算法包括一阶导数、二阶导数、基线校正、平滑处理、减法运算、归一化、多元散射校正(MSC)、标准正态变量变换(SNV)等多种方法。
基线校正方法中,均值中心化是一种基础的数据平移方法。它通过减去每个变量的均值,使变换后的变量均值为零。能让光谱数据的差异以零为基准,便于后续PCA/PLS分析。但由于各波长信号强度天然差异很大,故很少单独使用。自动缩放的目的是消除波长间量纲差异,让所有变量被“平等"对待。经过变换后,每个波长对所有样本的贡献在数值上变得同等重要。帕累托缩放是一种介于均值中心化和自动缩放之间的折中方案,使用标准差平方根作为缩放因子。可有效放大弱信号,抑制噪声。能更稳健地捕捉数据的真实变化,也能有效的提升微量元素较弱的信号,帮助模型建立更准确的定量关系。是LIBS数据建模的第一选择,推荐使用。

下面具体介绍一下光谱数据预处理算法对于LIBS光谱的作用及影响。
| 基线校正 (Baseline Correct) | 多种算法组合,旨在扣除由连续背景辐射产生的非线性基线。 | 此算法对于LIBS光谱的分析至关重要。LIBS信号常叠加在强连续背景上,基线校正是定量的必要步骤。 |
| 平滑(Smooth) | 通过移动平均、Savitzky-Golay等滤波器,降低白噪声等高频随机噪声。 | 此算法常用于LIBS光谱的分析,能有效提高信噪比。 |
| 一阶导数 (1st Derivative ) | 计算相邻波长点的强度差,凸显光谱的斜率变化特征。 | 此算法常用于LIBS光谱的分析,可有效抑制平移的基线漂移,增强峰形分辨能力,常用于分离重叠峰。 |
| 二阶导数 (2nd Derivative) | 对一阶导数结果再次求导,凸显光谱的曲率变化。 | 此算法常用于LIBS光谱的分析,能消除线性基线,提供比一阶导更高的分辨率,但对噪声更敏感。 |
| 归一化(Normalize) | 将光谱按面积(总强度)、背景或内标线进行缩放。 | 此算法常用于LIBS光谱的分析,用于校正激光脉冲能量波动等导致的整体强度变化。 |
| 多元散射校正(MSC) | 通过线性回归将各光谱校正至“理想"参考光谱。 | 此算法常用于LIBS光谱的分析,用于修正由样品颗粒度、表面不平整等物理因素引起的乘性和加性散射效应。 |
| 标准正态变量变换(SNV) | 每条光谱独立进行标准化(减去均值除以标准差),使数据服从正态分布。 | 此算法常用于LIBS光谱的分析,用于修正由样品颗粒度、表面不平整等物理因素引起的乘性和加性散射效应。但计算不依赖参考光谱,更独立。 |
| 其他算法,如Align, Divide By, Log10, Multiply, Subtract等 | 对于LIBS光谱作用不是很大 | 可根据实际情况按需使用 |
基于上述的说明,处理复杂基质样品LIBS光谱有效的方法原则是先粗后细,降噪优先,再进行适当的校正。本着精准实施预处理策略的原则。处理物理干扰(颗粒效应、能量波动)等,宜采用SNV 或 MSC的算法。消除复杂基线漂移,宜采用平滑和校正基线。增强谱峰分辨率、分离重叠峰,宜采用一阶导数和二阶导数。应对激光能量波动,宜采用归一化处理。在软件里一次性设置好顺序,同步运行。可有效提高数据分析效率及分析准度。处理流程可以是:原始光谱 → 平滑 → 基线校正→ 一阶导数 → SNV或MSC归一化 → 完成模型运算 → 检验准度。其中的归一化处理,如果样品均匀性较好,SNV效果通常不错;如果样品差异大且能找到合理的“参考光谱",MSC可能更优。当然用户也可以根据自己的实际情况和需求自行设定模型算法、执行顺序和更多细节的设定。
我们的实验为5组国标土壤样品的光谱曲线进行拟合,数据预处理算法分别为:Mean-center, Pareto + Smooth, Pareto + Smooth、Baseline Correct, Pareto + Smooth、Baseline Correct、1st Devivative、2nd Devivative、MSC、SNV。由于每个元素对激光的敏感度不一样,其在光谱上的表征也会不一样,因此针对不同的元素实际情况也可以采样不同的算法。比如Na元素的特征光谱是双峰,Mean-center的单一算法更适合。处理的原则是根据光谱的实际情况采用适当的算法,过多的算法叠加也会导致标准曲线的过度拟合,达不到预期,比如最后一种算法组合就属于过度拟合。数据结果中的r、Slope和SEP含义分别是拟合相关系数、斜率和预测标准误差。其中r的值越接近于1表示预测值与真实值的线性相关性越强,结果也会越好。Slope值大于1,说明模型对高浓度样品预测偏高,对低浓度样品预测偏低;如果小于1,则情况相反;越接近于1效果越理想。SEP值越小表示预测越精确。它直接反映了模型在预测新样本时的平均误差大小,单位与你的元素含量(如wt%)相同。例如加入Baseline Correct算法后就对降低SEP值有着较大的贡献,比如Pareto + Smooth、Baseline Correct 算法组合里针对Al元素的预处理效果有很大提升。

由数据表可见,采用Mean-center算法后,除Ca和Mg元素,其他元素拟合情况总体较好;其中Na元素,由于其特征光谱是双峰,Mean-center的单一算法更适合。采用Pareto + Smooth算法组合,所有元素拟合情况较好,r值均大于0.9。在此基础上增加Baseline Correct算法,r值进一步提升,Al元素的SEP值大幅减小,说明Baseline Correct算法对降低SEP值有着较大的贡献。最后一种多算法组合由于算法叠加太多,导致了过度的拟合。
综上所述,前期得到高质量的光谱需要按如下策略进行采集:较强的激光能量,多次脉冲累加,画线法采样,适当提前延迟时间,按需通入缓冲气体;对于质地疏松的样品可按比例加入粘合剂进行压片。后期计算推荐的光谱数据预处理算法组合为Pareto(帕累托缩放) + Smooth(5点平滑)、Baseline Correct(基线校正)。根据实际情况可以适当增加1st Devivative、2nd Devivative、MSC、SNV等预处理算法进行进一步的优化。或者针对个别特殊的元素进行特殊的算法优化方案。但切不可叠加过多的算法,导致过度的拟合。
实验装置采用北京澳作生态仪器有限公司自主研发的EcoChem 激光光谱元素分析系统,该系统采用激光诱导击穿光谱(LIBS)技术。激光能量200mJ@1064nm,能量输出0-100%可调;重现率20Hz;光斑大小50-300μm连续可调;三维全自动工作台;样品室可通入氦气或氩气。

通过本实验的分析研究,我们了解了光谱预处理的原则、各种算法的实际作用、建立了LIBS光谱预处理方法及定量精度优化策略有效的方法。激光诱导击穿光谱技术作为一种新兴的、快速的、微损的微区化学分析技术,有着传统仪器所不具备的更多功能。随着这一技术的发展,它必将在元素分析领域发挥越来越重要的作用。
联系我们
北京澳作生态仪器有限公司 公司地址:北京市海淀区路3号院6号楼1单元一层101A 技术支持:化工仪器网扫一扫 更多精彩
微信二维码
网站二维码