摘要:随着海洋中石油资源的不断开发,泄漏到海洋环境中的石油也日益增多,它不仅威胁着海洋生态环境,同时也严重影响着人们的身体健康。因此,快速、有效地检测出海洋环境中的石油类污染物对于保护海洋生态环境和人类健康具有重要意义。石油产品中含有大量的多环芳烃,其具有较强的荧光特性。因此,荧光光谱技术成为检测石油类污染物的重要手段之一。利用三维荧光光谱技术结合平行因子分析算法和模式识别方法,对石油类污染物进行表征和分类。首先,以海水和十二烷基硫酸钠(SDS)配制的胶束溶液作为溶剂,分别配制不同浓度的柴油、航空煤油、汽油和润滑油溶液,最终得到80个实验样本;然后,利用FLS920型荧光光谱仪采集实验样本的三维荧光光谱数据,并通过Delaunay三角形内插值法对所获得的三维荧光光谱数据进行去散射处理;其次,利用平行因子分析(PARAFAC)算法分解去散射后的三维荧光光谱数据,通过运用核一致诊断法和残差分析法对组分数进行估计;最后,为了建立稳健的分类模型,利用Kennard-Stone算法将80个实验样本分为60个训练集样本和20个测试集样本,运用K最近邻(KNN)算法、主成分判别分析(PCA-LDA)算法以及偏最小二乘判别分析(PLS-DA)算法分别建立分类模型,并利用灵敏度、特异性和准确率对分类效果进行评估。研究结果表明:三种分类模型对测试集中样本的识别准确率分别为85%,90%和94%,其中,PLS-DA分类模型对测试集样本的识别准确率最高,具有最佳的分类效果。因此,在利用平行因子分析算法提取石油类污染物荧光光谱数据的基础上,结合模式识别方法可以很好的对不同种类油品进行分类研究。利用三维荧光光谱技术结合平行因子分析算法和模式识别方法快速、有效地检测油类污染物,为石油类污染物的快速检测提供了一种新的研究思路和重要参考。
加入收藏
近几十年来,石油产品作为重要的能源及化工原料在现代社会中发挥着不可替代的作用。而随着对能源需求的持续增长,石油产品在开采、使用、运输及储存过程中不可避免地会存在发生泄露的可能性。石油类污染物严重影响附近水域的生态环境,造成附近水域范围内植物、鱼类和浮游生物等生物的大量死亡,间接影响人类的生命健康,而越来越多受到人们的关注[1]。针对石油类污染物的有效检测和识别是处理溢油污染问题的前提基础[2]。因此,研究一种快速、高效的石油类污染物成分识别和分类的检测手段,对于有关部门及时展开应急处理和后续生态环境的治理恢复工作具有重要的现实意义。
目前,针对石油类污染物进行检测的方法主要有红外光谱法、气相色谱法[3]、紫外分光光度法[4]、荧光光谱法[5]等。其中,三维荧光光谱法具有分析速度快、灵敏度高、非破坏性,以及能够表征更多荧光光谱信息等优点,成为一种用于石油类污染物检测的重要手段[6]。程朋飞等[7]利用三维荧光光谱法结合自加权交替三线性分解算法对多种石油类污染物进行了分析,实现了对石油类污染物的成分识别和浓度预测。杨丽丽等[8]利用三维荧光光谱法结合二阶校正算法对石油类污染物进行了检测,实现了对石油类污染物的定性定量检测。但上述方法存在对噪声容忍能力较弱和收敛速度慢等不足,限制了在实际复杂环境下的应用。借助近年来发展的模式识别方法,在利用平行因子分析算法提取石油类物质的荧光特征光谱的基础上,构建稳健的分类模型,解决了石油类物质难以准确识别和分类的问题,具有广阔的应用前景。
分别采集含有海水的四组单一油液的三维荧光光谱数据,利用Delaunay三角形内插值法对实验样本的三维荧光光谱数据进行去散射处理,并利用PARAFAC算法分解去散射后的三维荧光光谱数据,获得油品的荧光特征光谱,再通过模式识别方法对所提取的荧光特征光谱构建分类模型,从而建立针对石油类污染物的成分表征和油品种类分类的方法。
1、实验部分
1.1仪器设置与样本配制
实验样本的三维荧光光谱数据由购自英国EdinburghInstruments公司的FLS920型荧光光谱仪测得。激发波长的范围设定为260~500nm,发射波长的范围设定为280~520nm,激发和发射步长均为5nm;激发和发射端狭缝宽度设定为0.44nm。
选取市场购置的柴油(C)、航空煤油(H)、汽油(Q)和润滑油(R)作为污染物质,采用取自渤海秦皇岛海域的海水作为溶剂来配制实验样本。实验样本的配制步骤如下:(1)取适量海水和十二烷基硫酸钠(SDS)配制0.1mol·mL-1的样本溶剂,其目的是为了使油类更充分的溶于海水中;(2)利用精密电子秤称取航空煤油、汽油、柴油和润滑油各0.1g,用样本溶剂溶解并分别定容于10mL的容量瓶中,得到10mg·mL-1的一级储备溶液并避光保存;(3)分别取10mL的一级储备溶液,用样本溶剂稀释并定容于10mL的容量瓶中,配制成1mg·mL-1的标准溶液;(4)分别取不同体积的标准溶液,通过稀释配制成不同浓度的实验样本。
1.2数据处理方法
1.2.1平行因子分析算法(PARAFAC)
平行因子分析算法(PARAFAC)是一种基于交替最小二乘原理实现多维数据矩阵分解的算法[9]。实验样本测得的荧光光谱数据组成一个I×J×K型的三维响应数阵X,其中K为样本个数,I和J分别为激发波长和发射波长扫描个数。该算法对三维响应数阵X进行分解的过程可由三线性成分模型表示
xijk=∑n=1Νainbjnckn+eijk (1)
式中,i=1,2,…,I;j=1,2,…,J;k=1,2,…,K;xijk为三维响应数阵X中的元素;ain为相对激发矩阵AI×N中的元素;bjn为相对发射矩阵BJ×N中的元素;ckn为相对浓度矩阵CK×N中的元素;eijk为三维残差矩阵EI×J×K中的元素;N为矩阵AI×N,BJ×N和CK×N的列数,代表所有响应的组分数,包括目标分析物、未知和未校正的干扰物以及变化的背景等。
1.2.2偏最小二乘判别分析算法(PLS-DA)
偏最小二乘判别分析是一种基于偏最小二乘原理的数据分类算法[10]。在实验数据集合中,每个样品有m个预测变量X1,X2,…,Xm和一个分类变量Y;需将Y转换为q个潜在变量,即
{Yk=1,Y=kYk=0,Y≠k,k=1,2,⋯,q (2)
由矩阵Xn×m,Yn×q分别代表预测变量和分类变量矩阵。利用PLSDA算法对变量矩阵Xn×m和Yn×q进行分解,得到正交得分矩阵和载荷矩阵,其实现分解过程的计算公式为
{Xn×m=Τn×aΡa×mΤ+En×mYn×q=Un×aQa×qΤ+Fn×q (3)
式中,Tn×a和Un×q为隐变量得分矩阵;Pa×m和Qa×q为载荷矩阵;En×m和Fn×q为残差矩阵;a为特征提取的数目。
2、结果与讨论
2.1光谱预处理分析
经光谱仪扫描后得到的荧光光谱会存在Raman散射和Rayleigh散射,如图1(a)和(b)所示(以汽油样本为例)。散射的存在会导致利用PARAFAC算法建立的三线性成分模型带有偏差,严重影响油品的荧光特征分析。从(a)和(b)可以看出,散射的荧光峰过高,掩盖了汽油本身的荧光峰,所以在分析前需要去除散射的干扰。通过Delaunay三角形内插值法可以有效地消除散射的干扰。由图1(c)和(d)可知:经三维荧光光谱数据预处理后,油品的散射得到了有效去除,本身的荧光特征峰得到凸显。
2.2基于平行因子分析算法的分析结果
采用PARAFAC算法分析预处理后得到的80×49×25三维数据矩阵X。利用核一致诊断法和残差分析法确定分析时应选取的组分数,结果如图2(a)和(b)所示。当组分数超过7时,核一致值显著降低,残差平方和基本趋于稳定,故选取组分数为7。运用7因子PARAFAC模型对X进行分析,得到的结果如图2(c),(d)和(e)所示。由图2(c)和(d)可知:因子1的激发/发射荧光峰位置为280/325nm;因子2的激发/发射荧光峰位置为290/305nm;因子3的激发/发射荧光峰位置为310/330nm;因子4的激发/发射荧光峰位置为300/305nm;因子5的激发/发射荧光峰位置为340/395nm;因子6的激发/发射荧光峰位置为350/435nm;因子7的激发/发射荧光峰位置为270/305nm。由图2(e)可知:在三维得分图中,几种样品之间出现不同程度的重叠,这说明了仅用PARAFAC算法难以将不同石油类油品明显区分开。
2.3基于模式识别方法的分析结果
为了建立稳健的分类模型,先利用Kennard-Stone算法将实验样本划分为训练集和测试集。其中训练集包含60个实验样本,测试集包含20个实验样本。为了提高样本利用率,得到可靠稳定的模型,在建模前,采用留一法进行交叉验证,并按照使四类油品的校正误差最小的标准选取潜在变量数。灵敏度、特异性和准确率这三个参数能够评估所建立的分类模型的分类效果,KNN,PCA-LDA和PLS-DA分类模型对训练集的识别准确率都可达到100%,验证了三种模型的稳健性。
图1汽油的荧光光谱
(a):去散射前的三维荧光光谱;(b):去散射前的指纹图;(c):去散射后的三维荧光光谱;(d):去散射后的指纹图
图2PARAFAC算法的分析结果
(a):核一致值曲线;(b):残差平方和曲线;(c):相对激发光谱图;(d):相对发射光谱图;(e):因子得分图
图2PARAFAC算法的分析结果
(a):核一致值曲线;(b):残差平方和曲线;(c):相对激发光谱图;(d):相对发射光谱图;(e):因子得分图
利用经验证的分类模型来预测测试集中的20个独立样本。分类模型常用混淆矩阵来表示分类结果,由测试集获得的混淆矩阵如表1所示。其中黑体数字代表正确预测每类油品的样本个数。根据表1中混淆矩阵得出分类模型的灵敏度、特异性和准确率如表2所示。由表1和表2可以看出:这三种分类方法的灵敏度、特异性以及准确率都比较高,说明采用模式识别方法可以很好的对不同种类油品样本进行分类研究。对于KNN和PCA-LDA模型,识别准确率分别为85%和90%,相比而言,采用PLS-DA模型取得了更好的分类结果,测试集识别准确率达到了94%。
表1测试集获得的混淆矩阵
表2测试集得到的灵敏度、特异性和准确率
3、结论
利用三维荧光光谱技术结合平行因子分析算法和模式识别方法对多种石油类污染物进行了组成成分的荧光特性表征和油品种类的分类。研究结果表明,在利用Delaunay三角形内插值法去除实验样本中散射的基础上,利用PARAFAC算法分解得到的三线性组分模型所构建的PLS-DA分类模型较KNN和PCA-LDA分类模型具有最佳的分类效果,识别准确率最高,达到94%。本研究提供了一种三维荧光光谱技术与平行因子分析算法和模式识别方法相结合的油品检测方法,可为石油类污染物的快速检测提供一种新的思路和重要参考。
参考文献:
[1]刘保占,魏文普,段梦兰,等.海洋环境科学,2017,36(1):15.
[2]L李颖,李冠男,崔璨.海洋通报,2017,36(3):241.
[3]殷惠民,董亮,李玲玲,等.中国环境监测,2018,34(2):83.
[4]安乐.海洋环境科学,2017,36(2):303.
[6]沈海东,白玉洪,郑华.海洋石油,2017,37(2):61.
[7]程朋飞,王玉田,陈至坤,等.光谱学与光谱分析,2016,36(7):2162.
[8]杨丽丽,王玉田,鲁信琼.中国激光,2013,40(6):0615002.
孔德明,宋乐乐,崔耀耀,张春祥,王书涛.结合平行因子分析算法和模式识别方法的三维荧光光谱技术用于石油类污染物的检测[J].光谱学与光谱分析,2020,40(09):2798-2803.
基金:国家自然科学基金项目(61501394,61771419);河北省自然科学基金项目(F2016203155)资助;.
分享:
艾绒是干燥的艾叶经人工碾压或机械粉碎,过筛后所得到的软细如棉的绒状物。艾绒为灸用制品的原材料,具有温通经脉、调和气血、散寒止痛等作用,从艾绒中分离出来的主要化学成分有挥发油、总黄酮等。
2024-10-26白背叶楤木(Aralia chinensis Linn.var.nuda Nakai),俗名大叶槐木、刺老苞,为五加科楤木属楤木(Aralia chinensis)的变种,生于森林或灌丛中,主要分布于云南、广西、四川、甘肃等地,是珍贵的药食两用植物。其嫩茎叶作野菜凉拌食用,清凉可口,香味特别,具有清热解毒作用,其根、根皮、茎皮皆可入药,主要功效为镇痛、消炎、行气、祛风、利尿等。
2024-08-16籽瓜营养丰富,含人体必需的多种氨基酸、维生素,以及钾、钙、镁等微量元素,具有散热、解渴、利尿等功效。研究发现,内皮、瓜瓤和瓜籽中含有蛋白质和可溶性总糖,利用芬顿法测定籽瓜瓜皮部位多糖的抗氧化活性,结果表明,其提取物对羟自由基和1,1-二苯基-2-苦基肼(DPPH)自由基的清除效果较好,因而可以推测出籽瓜具有一定的抗氧化活性。
2024-08-15茶多酚是茶叶中多酚类物质的总称,主要由儿茶素类、花色素类、花黄素类、缩酸、缩酚酸类物质组成。其中,表没食子儿茶素没食子酸酯是儿茶素中含量最高、活性最强的成分,常占后者总量的50%,具有特殊的立体化学结构、很强的抗氧化活性,在抗肿瘤、抗突变、抗衰老、抗炎、抗病毒等方面有着出色表现。
2023-11-24蛤壳是一种传统海洋中药,来源于帘蛤科动物文蛤Meretrix meretrix Linnaeus或青蛤Cyclina sinensis Gmelin的贝壳,其药用历史已有2 000余年,具有“清热化痰,软坚散结,制酸止痛;外用收湿敛疮”之功效,用于痰火咳嗽,胸胁疼痛,痰中带血,瘰疬瘿瘤,胃痛吞酸;亦可用于治疗咳喘。
2023-11-07沉香是一味名贵中药,具有抗菌、抗氧化、消炎、助眠、止咳等药理作用,基于沉香开发的中成药有上百种,衍生的系列产品在中医药、康养保健等领域发挥着重要作用。白木香(Aquilaria sinensis(Lour.)Gilg)是我国唯一的生产沉香的基源植物[4],主要产于我国海南、广东、广西等地。
2023-10-31天然药物化学是药学、中药学专业的专业必修课,是运用现代科学理论与方法研究天然药物中化学成分的一门学科,主要研究天然药物中各类化学成分的结构特征、物理化学性质、提取分离方法、结构鉴定与生物活性、生物合成规律及途径、体内外动态变化等。芦丁(rutin)是糖苷类黄酮的一种,由槲皮素(quercetin)3位上的羟基与芸香糖(葡萄糖与鼠李糖1-6连接而成的双糖)脱水而成。
2023-10-20双酚A(bisphenol A, BPA) 是一种重要的内分泌干扰物,受到广泛重视。它能够通过扰乱内分泌系统,影响人体免疫功能,从而引发多种疾病,包括生殖功能障碍、肥胖、糖尿病和癌,特别影响儿童的健康。
2023-10-14芦丁是一类重要的黄酮类化合物, 在荞麦植物中广泛存在, 具有抗肿瘤、 抗糖尿病、 抗氧化、 抗炎、 抗糖尿病、 抗脂肪、 降血压、 稀释血液等多种生理功能。 芦丁可能存在于多种草药复方制剂中, 是临床应用的治疗剂原料药。 芦丁具有多种生理和药理作用, 近年来受到人们的广泛关注。
2023-10-12近年来,中药材半枝莲因其抗肿瘤疗效显著而受到了学者们的广泛关注,多糖作为半枝莲的主要成分之一,发挥了至关重要的作用。因此,研究半枝莲多糖的生物活性对于开发抗癌药物具有深远的意义。本文通过对半枝莲的多糖类活性成分及其相关药理作用的研究情况展开综述,以期能够为探讨半枝莲的深入应用研究提供科学参考,为进一步研究开发和推广应用半枝莲多糖在药物治疗癌症相关领域提供科学依据。
2021-08-19人气:5665
人气:3884
人气:3672
人气:2600
人气:2305
我要评论
期刊名称:化学研究
期刊人气:708
主管单位:河南大学
主办单位:河南大学
出版地方:河南
专业分类:化学
国际刊号:1000-8217
国内刊号:11-1730/N
邮发代号:82-413
创刊时间:1997年
发行周期:双月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:2.741
影响因子:1.160
影响因子:1.215
影响因子:0.770
影响因子:0.374
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!