关键词:
食用油
拉曼光谱
反向传播神经网络
粒子群算法
遗传算法
黄金正弦算法
摘要:
近年来食用油安全事件频发,油品运输环节的交叉污染、非法掺假、以次充好等问题突出,因此,迫切需要一种快速、无损的检测方法以保障食用油安全。
本文提出将反向传播神经网络模型(Back Propagation Neural Network,BPNN)的应用于食用油拉曼光谱的分类检测中,同时在BPNN模型中融入粒子群算法(Particle Swarm Optimization,PSO)、遗传算法(Genetic Algorithm,GA)、黄金正弦算法(Golden Sine Algorithm,GSA)等智能优化算法,可有效优化BPNN参数空间的搜索过程,克服传统BPNN模型存在的局部最优问题,并提升收敛速度,从而提高模型的准确率和泛化性,为食用油检测提供更精准、更可靠的技术支持。因此,本论文主要以四种植物油与一种动物油为研究对象,研究内容与研究结果分为以下四部分:
(1)使用拉曼光谱仪采集金龙鱼牌菜籽油、大豆油、玉米油、花生油以及一种猪油这5种单油品在400 cm-1~3000cm-1范围内的光谱数据。由于油品的拉曼光谱包含众多的谱峰,这些谱峰相互重叠、干扰,难以直接从原始光谱中准确地解析出各种成分及其含量信息,需要借助更强大的数据分析方法来挖掘光谱中的隐藏信息,以实现对掺假食用油的有效检测。
(2)针对上述采集到的油品拉曼光谱数据存在的复杂特征信息,首先,对其进行SG平滑和基线校正的预处理,并用主成分分析法(Principal Component Analysis,PCA)提取特征变量;其次将特征变量作为BPNN模型的输入,从而进行训练;将构建的PSO-BPNN、GA-BPNN、GSA-BPNN三种优化模型与传统的BPNN模型的训练结果对比分析。结果表明:传统的BPNN模型准确率仅有80.00%,PSO-BPNN与GA-BPNN模型的准确率都为83.33%,GSA-BPNN模型准确率较为优秀,能达到90.00%,同时GSA-BPNN模型的绝对百分比误差MAPE(Mean Absolute Percentage Error)和均方根误差RMSE(Root Mean Square Error)表现出更好的结果,分别为0.0025与0.0509,较其余三种模型的误差都相对低出大与1倍以上。因此,GSA-BPNN模型性能更优。
(3)前面提出的三种BPNN模型对于单油品检测有可行性,但还需要研究市场上繁杂的混合食用油的检测。针对5种单油品,将猪油分别以10%、20%、30%、50%的掺杂比例掺入4种植物油中,共制备出16份样品。提出多算法融合策略,优化出PSO-GSA-BPNN和GA-GSA-BPNN两种模型,其训练集中对掺杂油样品的拉曼光谱数据的检测准确率分别为87.50%、95.31%。
(4)采用常见的RMSE、MAPE、R2三种模型评价指标,用来量化模型的泛化性,结果表明BPNN、PSO-BPNN、GA-BPNN和GSA-BPNN模型在对单油品检测时,其RMSE分别为02042、0.0911、0.0995、0.0991;MAPE分别为0.1167、0.0250、0.2083、0.0225,且GSA-BPNN的R2高达0.9850,说明该模型表对单品类食用油的检测是精准的;而在掺杂油品的检测中,GA-GSA-BPNN模型测试集识别准确率为95.83%,且其RMSE和MAPE为0.0446与0.0198,R2为0.9012,表现出较好的检测性能。