打开客服菜单
當前位置:紅外光譜儀 > 紅外光譜之家 > 紅外光譜韩国高清 > 稻谷脂肪近紅外光譜特征篩選及檢測模型構建

韩国高清

  • 韩国高清 : 4000-180-060
  • 韩国高清 : 131-0228-4693
  • 企业QQ : 56250774
  • 韩国高清 : info@np17.cn
  • 网址 :
  • 韩国高清 : 天津濱海新區華苑産業園區(環外)海泰創新六路2號華鼎新區一號3號樓1門10層
稻谷脂肪近紅外光譜特征篩選及檢測模型構建
编辑 :

天津市能譜科技有限公司

时间: 2018-05-01 浏览量: 195


稻谷脂肪近紅外光譜特征篩選及檢測模型構建

李路1,黃漢英1*,李毅1,趙思明2,楊素仙1

1(华中农业大学 工学院,湖北 武汉,430070) 2(华中农业大学 食品科技学院,湖北 武汉,430070)

摘 要 应用近红外光谱技术对稻谷脂肪含量进行检测。采集了90个稻谷样本的漫反射近红外光谱,运用Kennard-Stone法选取校正集及预测集样本。对比研究了归一化、一阶导、二阶导、一阶导+归一化等4种预处理方法对模型性能的影响,确定一阶导为最佳预处理方法。运用竞争性自适应重加权采样技术筛选出与稻谷脂肪含量检测相关的特征波长,再用多元线性回归对特征波长进行优选,最终得到30个特征波长。其中最典型的特征波长为1 343、1 489和1 583 nm,反映了稻谷脂肪中大量存在的—CH和—OH基团。所建立的基于近红外光谱分析技术的稻谷脂肪含量检测模型具的决定系数为0.958 9,定标标准差RMSEC为0.223 6,相对偏差为5.53%。

關鍵詞 近紅外光譜;稻谷;脂肪;競爭性自適應重加權采樣;多元線性回歸

脂肪含量是評價稻谷品質的重要指標[1]。而其傳統測定方法存在過程繁瑣、條件不易控制、藥品消耗大、費時費力等不足。近紅外光譜分析技術以其檢測過程簡單迅速、耗材少、無損、分析重現性好、成本低等優點,在糧食、蔬果、肉制品等方面的檢測中得到了廣泛的應用[2-4]

目前國內外學者利用近紅外分析技術做了一些食品檢測方面的研究,BAGCHI等[5]、SUN等[6]和XIE等[7]建立了稻米中蛋白質及澱粉含量的檢測模型。SIRISOMBOON等[8]研究了稻谷中黃曲黴素的近紅外檢測方法。張中衛等[9]、郭中華等[10]和趙明富等[11]建立了牛奶中脂肪和蛋白質含量的數學模型。林家永等[12]對不同品種和儲存期限的大米水分、脂肪酸值進行檢測。上述研究所建立的數學模型對食品主要營養成分的檢測都能取得較好的精度,檢測結果的決定系數R2大多在0.8以上,但是模型的建立思路主要集中在2個方面:(1)根據食品營養成分中特殊化學基團所對應的近紅外光譜特征波長建立模型,具有模型簡單,物理意義明確的優點,但檢測結果不穩定,精度不高;(2)利用近紅外光譜全波長建立模型,具有適應性廣,精度理想的優點,但模型複雜,計算量較大。

本文针对模型性能与复杂度的矛盾关系,采用竞争性自适应重加权采样(competitive adaptive reweighted sampling,CARS)[13]方法,在稻谷近紅外光譜的全波段,篩選出適量的特征波長,然後采用多元線性回歸法建立稻谷脂肪含量的檢測模型,在保證較好模型性能的前提下盡量減小計算量,爲快速檢測稻谷主要營養成分提供新的方法。

1 材料与方法

1.1 試驗材料

試驗材料包含A4A/R326、巨風A/R257、廣占S/R166、中9A/R591、岡紅1A/R15等46個品種的稻谷,由黃岡農科院提供,産自海南省。袋裝封存于陰涼處,收獲至試驗在2個月內完成。將部分品種按質量1∶1的比例兩兩混合,得到44個混合樣本,共計90個稻谷樣本。

1.2 試驗設備與樣本光譜采集

紅外光譜儀:漫反射式Supnir-2720近紅外光譜儀,杭州聚光科技股份有限公司。其测定范围为1 000~1 799 nm,光谱采样间隔为1 nm,光谱分辨率为10 nm。为减小误差,每个样本扫描3次。稻谷籽粒置于样本盘内,且装满、压实,逐一扫描。

1.3 稻谷脂肪含量測定

按照GB/T 5511—2008《粮油检验 粮食中粗脂肪含量测定》中的索氏抽提法[14]測定稻谷的脂肪含量,取3次測定的平均值。

1.4 數據處理方法

1.4.1 样本集划分

運用Kennard-Stone方法[15]對90個稻谷樣本進行分組,80%爲校正集,20%爲驗證集,分別用于模型的建立與驗證。Kennard-Stone方法基于變量之間的歐氏距離,在樣本光譜的特征空間中均勻選取樣本,依次選取歐氏距離最遠的點,進入校正集,留下馬氏距離居中的點在驗證集之中[16]。這樣可使光譜差異較大的樣本全部進入校正集,從而在一定程度上避免了校正集樣本分布的不均勻。

1.4.2 近红外光谱预处理

預處理能將光譜的有效信息放大,且將光譜壓縮在相同的範圍進行比較,消除了基線漂移、樣品不均勻、光散射、光程變化等對光譜的影響。選擇合適的預處理方法,對提高模型的檢測能力和精度十分重要。本文運用歸一化、一階導、二階導等預處理方法中的一種或多種的組合對稻谷近紅外光譜做預處理。然後根據不同預處理方法所建立模型的性能指標來確定最終的光譜預處理方案。

1.4.2.1 归一化

在建立近紅外定量模型前,爲了將光譜的有效信息放大,常采用歸一化來進行預處理,使光譜數據的方差爲1,均值爲0,將光譜數據放在相同的範圍進行比較[17]。本文運用Z-score歸一化進行預處理試驗。

1.4.2.2 一阶导

導數法可消除基線偏移、背景幹擾出現的譜線重疊,呈現變化明顯的波峰波谷,提供比原始光譜更清晰的光譜輪廓變化[18]

1.4.2.3 二阶导

原始光譜經過二階導數處理後,會變得很尖銳,有利于更好的確定波峰和波谷的位置,可使各吸收峰變得更容易區分。二階導數可以消除基線的線性傾斜[19]

1.4.3 特征波长筛选

稻谷脂肪的近紅外光譜波長點數爲800個,而樣本數是90個,利用此數據進行回歸分析,共線性非常嚴重。利用CARS方法[20]對特征波長進行篩選可簡化模型,並提高模型的檢測能力。

1.4.4 建模

爲了降低模型的運算量,便于後續研究中在線快速檢測系統的開發,使用多元線性回歸方法建立基于近紅外光譜分析技術的稻谷脂肪含量檢測模型,以模型的決定系數(R2)、定標標准差(RMSEC)、相對偏差來評價模型的穩定性、檢測能力和優劣。當R2越趨近于1,RMSEC和相對偏差的值越趨近于0,則模型的穩定性和檢測能力越好,在實際中的檢測越准確。同時,在建模的過程中通過顯著性指標進一步對特征波長進行優選,使模型進一步簡化。

2 结果与分析

2.1 樣本近紅外光譜

圖1爲90個稻谷樣本的近紅外光譜圖。可見,不同樣本的近紅外光譜在總體趨勢上是一致的。但由于物質成分含量的微小差異,不同樣本的吸光度略有不同。

图1 90个稻谷样本的原始近红外光谱图
Fig.1 Original Near-infrared spectra of ninety rice samples

2.2 樣本集劃分結果

采用Kennard-Stone法選取校正集與驗證集,結果見表1。驗證集的範圍包含在校正集內,分組合理。

表1 Kennard-Stone 分組結果
Table1 Results of Kennard-Stone

2.3 樣本預處理

4種預處理方法後的結果如圖2和表2所示。由表2可知,運用一階導處理後所建模型的決定系數最大、定標標准差最小,因此選用一階導爲最佳的預處理方法。

图2 经过4种预处理后的光谱图
Fig.2 Spectra after 4 preprocessing methods

表2 不同預處理方法的比較
Table2 Comparison of different pretreatments

2.4 特征波長篩選

對光譜進行預處理後,采用CARS方法對稻谷脂肪的特征波長進行多次篩選,其篩選過程如圖3所示。圖3-a爲篩選過程中選出變量的變化趨勢,隨著運行次數的增加,保留的變量數越來越少,且由快到慢呈指數函數遞減。圖3-b爲波長變量篩選過程中交叉驗證均方差RMSECV的變化趨勢,在1~53次采樣過程中,RMSECV呈現遞減趨勢,表明篩選過程中剔除了與樣本性質無關的變量,此時對應的變量數爲34,53次後開始遞增,說明篩選過程中開始剔除了與稻谷脂肪含量相關的變量,從而導致RMSECV值增大,可見在第53次時,已將無關變量全部剔除,最後保留波長數34個。圖3-c中“*”所對應的點即爲RMSECV最低點,圖3-c中各線表示隨著運行次數增加各波長變量回歸系數的變化趨勢。特征波長篩選時蒙特卡羅采樣次數爲100,挑選出的34個特征波長見圖4。

图3 稻谷脂肪特征波长筛选图
Fig.3 Key wavelengths selection of fat in rice

2.5 稻谷脂肪數學模型的建立

運用多元線性回歸方法,以34個特征波長建立稻谷脂肪含量的檢測模型,將顯著性不高的特征波長剔除,優選特征波長,最終得到30個特征波長,回歸系數及顯著性見表3。檢測模型的具體形式爲:

图4 稻谷脂肪特征波长的分布情况(o表示特征波长)
Fig.4 Distribution of key wavelengths (shown by “o”) for fat in rice

y=b+∑aixi

(1)

式中:y,稻谷脂肪含量;b,回歸常數項;ai,各特征波長的回歸系數;xi,特征波長的吸光值經過一階導數處理後的數值;i=1 000, 1 001, … , 1 799,波长所对应的纳米数。

表3爲稻谷脂肪檢測模型的參數及其顯著性。可見,在x1 343x1 489x1 583處,回歸系數的絕對值最大,說明這些特征波長對模型的影響最大,t值相对较大,说明对模型的影响较显著。其中,1 343 nm反映了C—H基团的第二组合频和O—H基团的伸缩振动的二级倍频吸收带,1 489 nm反映了O—H基团的伸缩振动的二级倍频,1 583 nm反映了O—H基团的伸缩振动的一级倍频吸收带。检测模型的决定系数R2为0.958 9,定标标准差RMSEC为0.223 6,相对偏差为5.53%,说明模型具有较好的稳定性和准确性。

表3 稻谷脂肪檢測模型的參數及其顯著性
Table 3 Parameters and significances of fat prediction model

利用上述回归方程预测18个验证集的脂肪含量,偏差的绝对值最大为0.716 1,最小为0.003 2,模型验证的决定系数R2为0.825 0,校验标准差RMSEP为0.339 8,相对偏差为8.55%,说明所建模型具有较好的检测能力。

3 结论

本文首先采集了90个稻谷样本的漫反射近红外光谱,使用Kennard-Stone法选取了校正集与验证集。然后对比了归一化、一阶导、二阶导、一阶导+归一化等4种预处理方法对模型性能的影响,使用CARS法确定了与稻谷脂肪含量检测相关的近红外特征波长。最后利用多元线性回归理论对特征波长进行优选,并建立了基于近红外光谱分析技术的稻谷脂肪含量的检测模型。结果表明,稻谷红外光谱的最佳预处理方法为一阶导,与稻谷脂肪含量检测相关的近红外特征波长为30个,其中最典型的特征波长为:1 343、1 489和1 583 nm。检测模型的决定系数R2为0.958 9,定标标准差RMSEC为0.223 6,相对偏差为5.53%。将检测模型用于验证集,偏差的绝对值最大为0.716 1,最小为0.003 2,模型验证的决定系数R2为0.825 0,校验标准差RMSEP为0.339 8,相对偏差为8.55%,说明所建模型具有较好的稳定性和检测能力。

參考文獻

[1] 黄丽, 柏芸, 韩文芳, 等. 稻米质量对食品安全的影响[J]. 中国粮油学报, 2013, 28(4): 113-117.

[2] MILICA M P, JASNA S M. Near infrared spectroscopy-advanced analytical tool in wheat breeding, trade, and processing [J]. Food and Bioprocess Technology, 2013, 6: 330-352.

[3] 陈辰, 鲁晓翔, 张鹏, 等. 玫瑰香葡萄贮藏期间糖酸品质的近红外检测[J]. 食品与发酵工业, 2015, 41(6): 175-180.

[4] 涂斌, 陈志, 彭博, 等. 基于多源光谱特征融合技术的花生油掺伪检测[J]. 食品与发酵工业, 2014, 42(4): 169-173.

[5] BAGCHI T B, SHARMA S G, CHATTOPADHYAY K. Development of NIRS models to predict protein and amylose content of brown rice and proximate compositions of rice bran [J]. Food Chemistry, 2016, 191(1): 20-27.

[6] SUN Cheng-xiao, YU Yong-hong, DUAN Bing-wu, et al. Rapid prediction of rice quality characteristics by near-infrared reflectance spectroscopy for breeding programs [J]. Cereal Chemistry, 2014, 91(3): 270-275.

[7] XIE L H, TANG S Q, CHEN N, et al. Optimisation of near-infrared reflectance model in measuring protein and amylose content of rice flour [J]. Food Chemistry, 2014, 142: 92-100.

[8] SIRISOMBOON C D, PUTTHANG R, SIRISOMBOON P. Application of near infrared spectroscopy to detect aflatoxigenic fungal contamination in rice [J]. Food Control, 2013, 33(1): 207-214.

[9] 张中卫, 温志渝, 曾甜玲, 等. 微型近红外光纤光谱仪用于奶粉中蛋白质脂肪的定量检测研究[J]. 谱学与光谱分析, 2013, 33(7): 1 796-1 800.

[10] 郭中华, 王磊, 金灵, 等. 基于近红外透射光谱的乳制品蛋白质、脂肪含量检测[J]. 光电子·激光, 2013(6): 1 163-1 168.

[11] 赵明富, 施玉佳, 罗彬彬, 等. 基于近红外透射光谱的牛奶中脂肪和蛋白质含量检测[J]. 激光杂志, 2014(1): 44-45.

[12] 林家永, 范维燕, 薛雅琳, 等. 稻米储藏品质近红外光谱快速判定技术及仪器研发[J]. 中国粮油学报, 2011, 26(7): 113-118.

[13] LI Hong-dong, LIANG Yi-zeng, XU Qing-song, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta, 2009, 648(1): 77-84.

[14] GB 5009.5—2010. 食品安韩国高清家标准: 食品中蛋白质的测定[S].

[15] 陈鑫. 基于智能算法的近红外光谱分析预测模型建立方法研究[D]. 无锡:江南大学, 2013.

[16] 张华秀, 李晓宁, 范伟, 等. 近红外光谱结合CARS变量筛选方法用于液态奶中蛋白质与脂肪含量的测定[J]. 分析测试学报, 2010, 29(5): 430-434.

[17] 王艳阳, 魏永霞. 基于Z比分数的参考作物腾发量计算方法优选[J]. 节水灌溉, 2015, 29(3): 52-54.

[18] 宋丽华. 花生籽仁蛋白质含量近红外光谱模型的建立及育种应用[D]. 保定:河北农业大学, 2011.

[19] 白雁, 余振喜, 孙素琴, 等. 近红外漫反射光谱技术测定牛膝中蜕皮甾酮[J]. 中草药, 2005, 36(9): 115-118.

[20] 刘星, 单杨, 李高阳. CARS结合PLS-LDA法识别奶牛饲料中土霉素的可行性研究[J]. 包装与食品机械, 2012, 30(4): 1-4.


Establishment of a selection and detection model of fat inrice by nearinfrared spectrum characteristics

LI Lu1, HUANG Han-ying 1*, LI Yi1, ZHAO Si-ming2, YANG Su-xian1

1 (College of Engineering, Huazhong Agricultural University, Wuhan 430070, China) 2 (College of Food Science & Technology, Huazhong Agricultural University, Wuhan 430070, China)

ABSTRACT Near Infrared (NIR) spectrum was used to detect fat content in rice. NIR spectra of 90 rice samples were measured. Kennard-Stone method was used to select the calibration set and prediction set samples. The effects of different pretreatment (normalize, first derivative and second derivative methods) have been compared for the accuracy of the models. The best pretreatment method is the first derivative. The competitive self-adaptive weighted sampling technology is used to screen the key wavelengths associated with sample properties. Finally, thirty key wavelengths are selected by Multiple Linear Regression further. The most typical key wavelengths are 1 343 nm, 1 489 nm and 1 583 nm which related to the groups of —CH and —OH in rice fat. The detection model of fat content of rice based on near infrared spectroscopy has higher precision with the coefficient of determination, root mean square error of calibration and relative deviation are 0.958 9, 0.223 6 and 5.53%, respectively.

Key words near infrared spectrum; rice; fat; competitive adaptive reweighted sampling; multiple linear regression

DOI:10.13995/j.cnki.11-1802/ts.014950

引用格式:李路,黃漢英,李毅,等.稻谷脂肪近紅外光譜特征篩選及檢測模型構建[J].食品与发酵工业,2018,44(2):87-91.

第一作者:博士,講師(黃漢英碩士爲通訊作者,韩国高清:hhywmx@mail.hzau.edu.cn)。

基金項目:中央高校基本科研業務費專項(2662015PY078);湖北省重大科技創新計劃(2014ABC009)

收稿日期:2017-06-13,改回日期:2017-06-21

上一篇: 红外光谱测试样品制备中的常规与特殊攻略合集 下一篇: 傅里叶变换红外光谱法常见“套路”
cache
Processed in 0.005477 Second.