近紅外光譜分析中建模校正集的選擇_第1頁(yè)
已閱讀1頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、?19942010ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.第29卷第10期光譜學(xué)與光譜分析Vol129No110pp2661226642009年10月SpectroscopySpectralAnalysisOctober2009近紅外光譜分析中建模校正集的選擇秦沖1陳雯雯1何雄奎1張錄達(dá)13馬翔21.中國(guó)農(nóng)業(yè)大學(xué)理學(xué)院北京1001932.紅塔集團(tuán)技術(shù)

2、中心云南玉溪653100摘要將極大線性無(wú)關(guān)組的概念及方法引入近紅外光譜分析探討了在建立定量分析模型時(shí)代表性樣品即校正集樣品的選擇問(wèn)題。以2652個(gè)煙末樣品為實(shí)驗(yàn)材料隨機(jī)選取1001個(gè)樣品構(gòu)成預(yù)測(cè)集其余1651個(gè)樣品為代表性樣品備選集。用Matlab軟件求出代表性樣品備選集光譜矩陣的極大線性無(wú)關(guān)組以此作為代表性樣品構(gòu)成建模的校正集。用PLS回歸法建立了煙末樣品總糖含量定量分析的預(yù)測(cè)模型并將模型用于預(yù)測(cè)集中1001個(gè)煙末樣品總糖含量的預(yù)測(cè)分

3、析。實(shí)驗(yàn)結(jié)果表明當(dāng)選擇的校正集包含的樣品數(shù)量大于32時(shí)所建各模型對(duì)預(yù)測(cè)集樣品預(yù)測(cè)的平均相對(duì)誤差均小于4%平均相關(guān)系數(shù)大于0196。其中選擇32個(gè)代表性樣品和146個(gè)代表性樣品所建模型定量分析預(yù)測(cè)集中各樣品的總糖含量?jī)蓚€(gè)結(jié)果經(jīng)統(tǒng)計(jì)檢驗(yàn)沒(méi)有顯著性差異(α=0105)說(shuō)明求極大線性無(wú)關(guān)組的方法用于校正集樣品的選擇可實(shí)現(xiàn)“少而精”選擇樣品的目的。此外我們用求極大線性無(wú)關(guān)組選擇校正集樣品和隨機(jī)方法選擇校正集樣品兩種方法選擇了同樣數(shù)目2832417

4、6146163個(gè)樣品建模進(jìn)行預(yù)測(cè)效果的對(duì)比實(shí)驗(yàn)結(jié)果顯示求極大線性無(wú)關(guān)組法選擇校正集建模的預(yù)測(cè)效果優(yōu)于隨機(jī)選擇校正集建模的預(yù)測(cè)效果。關(guān)鍵詞近紅外光譜代表性樣品選擇極大線性無(wú)關(guān)組中圖分類號(hào):O65713文獻(xiàn)標(biāo)識(shí)碼:ADOI:1013964j1issn1100020593(2009)1022661204收稿日期:2008209202修訂日期:2008212206基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(3037091520575076)和國(guó)家高技術(shù)研究

5、發(fā)展計(jì)劃“863”計(jì)劃項(xiàng)目(2007AA10Z208)資助作者簡(jiǎn)介:秦沖1987年生中國(guó)農(nóng)業(yè)大學(xué)理學(xué)院本科生3通訊聯(lián)系人e2mail:zhangld@cau1edu1cn引言隨著計(jì)算機(jī)技術(shù)的發(fā)展近紅外光譜儀器制造技術(shù)的完善近紅外光譜分析技術(shù)逐漸成為備受青睞的分析技術(shù)擁有分析巨人的美名[1]。目前近紅外光譜分析的應(yīng)用領(lǐng)域已涉及農(nóng)產(chǎn)品[2]、石油化工產(chǎn)品、生命科學(xué)與醫(yī)藥、液態(tài)食品、化學(xué)品分析、紡織品行業(yè)、輕工行業(yè)、煙草行業(yè)[34]、動(dòng)物飼料

6、、酒類鑒別、環(huán)境等這些進(jìn)展與近紅外光譜分析技術(shù)的速度快、效率高、成本低、綠色無(wú)損、測(cè)試重現(xiàn)性好、測(cè)量方便等優(yōu)點(diǎn)是密不可分的[56]。近紅外光是指介于可見(jiàn)光與中紅外光之間的電磁波ASTM(Americansocietyftestingmaterials)將近紅外波長(zhǎng)規(guī)定為780~2526nm(12800~3959cm1)[7]。物質(zhì)分子中的C—HN—HO—H和C═O等基團(tuán)基頻振動(dòng)的合頻與倍頻吸收在近紅外區(qū)信息量非常豐富。因此近紅外技術(shù)比較

7、適合于分析與這些基團(tuán)有直接或間接關(guān)系的化學(xué)成分[8]。由于煙草中的煙堿、總糖、總氮等物質(zhì)都包含了這些基團(tuán)近紅外分析技術(shù)也被煙草行業(yè)作為現(xiàn)場(chǎng)快速測(cè)定的重要手段[910]近年來(lái)在煙草常規(guī)成分的分析中發(fā)揮著越來(lái)越廣泛的作用[11]。煙葉所包含的化學(xué)成分決定煙葉的品質(zhì)用化學(xué)成分評(píng)價(jià)煙葉的質(zhì)量具有客觀性[12]。以往的化學(xué)方法檢測(cè)煙葉中的化學(xué)成分過(guò)程繁瑣速度慢且會(huì)造成污染和浪費(fèi)現(xiàn)在并不為人們所大量采用。隨著近紅外光譜分析技術(shù)的發(fā)展煙葉中化學(xué)成分的

8、測(cè)定變得簡(jiǎn)便和快速。這種方法具有效率高、無(wú)損傷、無(wú)污染的優(yōu)勢(shì)因此成為今后煙葉質(zhì)量評(píng)價(jià)的發(fā)展趨勢(shì)。近紅外光譜定量分析需要建立回歸模型。用有代表性的樣品作為校正集建模不但可以減少化學(xué)分析的工作量而且直接影響所建模型的適用性和準(zhǔn)確度是近紅外分析技術(shù)中提高效率、減少成本的重要方法[13]。目前選擇模型校正集的最常用方法是隨機(jī)選取[14]。其缺點(diǎn)是偶然性大且有時(shí)隨機(jī)選取出來(lái)的樣品無(wú)法很好地反映所有樣品的信息導(dǎo)致預(yù)測(cè)效果不好。根據(jù)樣品化學(xué)值而進(jìn)行正

9、態(tài)分布或均勻分布的選取需要測(cè)量大量樣品的化學(xué)值以供選擇。本文將極大線性無(wú)關(guān)組的概念應(yīng)用于校正集樣品的選擇中方法簡(jiǎn)單可行得到了較好的效果。?19942010ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.Fig12Crelationbetweenpredictivevalueschemicalana2lyzingvaluesofcalibrationset(a

10、)predictionset(b)另一方面討論了極大線性無(wú)關(guān)組的方法選擇代表性樣品建立預(yù)測(cè)模型的穩(wěn)定性。實(shí)驗(yàn)中用極大線性無(wú)關(guān)的方法分別選取包含樣品數(shù)為28324176146163個(gè)樣品的校正集建立模型對(duì)預(yù)測(cè)集中的1001個(gè)樣品的總糖含量進(jìn)行預(yù)測(cè)相關(guān)結(jié)果列于表1。作為比較實(shí)驗(yàn)中用隨機(jī)方法分別選取樣品數(shù)量為28324176146163個(gè)樣品構(gòu)成校正集同樣的過(guò)程建立模型對(duì)預(yù)測(cè)集中的1001個(gè)樣品的總糖含量進(jìn)行預(yù)測(cè)。相關(guān)結(jié)果列于表2。由表2和表

11、1可見(jiàn)極大線性無(wú)關(guān)選擇樣品建模的預(yù)測(cè)Table1Predictingresultsofmodelsobtainedbyingdif2ferentamountofmaximumlinearlyindependentsam2ples實(shí)驗(yàn)序號(hào)極大線性無(wú)關(guān)的樣品數(shù)相關(guān)系數(shù)(r)平均相對(duì)誤差(RV%)12801953441100423201964331621034101963931597647601966931369151460196203162

12、476163019679314186Table2Predictingresultsofmodelsobtainedbyromlyingdifferentamountofsamples實(shí)驗(yàn)序號(hào)隨機(jī)選擇的樣品數(shù)相關(guān)系數(shù)(r)平均相對(duì)誤差(RV%)12801871661985523201920461236434101916051676647601921951494851460195064124266163019557410104效果總體上明顯

13、優(yōu)于隨機(jī)選擇樣品建模。說(shuō)明從大量樣品中用確定極大線性無(wú)關(guān)組法選出的代表性樣品能更好地反映樣品的信息更具有代表性。實(shí)驗(yàn)中還發(fā)現(xiàn)隨機(jī)選取樣品的偶然性比較大當(dāng)選擇樣品數(shù)量較少時(shí)建模預(yù)測(cè)的效果不穩(wěn)定。隨著近紅外技術(shù)的發(fā)展近紅外光譜數(shù)據(jù)的采集變得越來(lái)越簡(jiǎn)單快捷。極大線性無(wú)關(guān)選擇代表性樣品僅僅依據(jù)樣品的光譜信息在沒(méi)有顯著性差異的前提下僅選擇少量代表性樣品建模就可以達(dá)到很好的預(yù)測(cè)效果。這樣建立模型時(shí)只有所選擇的少量代表性樣品需要測(cè)定待測(cè)的化學(xué)成分含量

14、因此能夠減少?gòu)?fù)雜而繁瑣的對(duì)樣品進(jìn)行化學(xué)分析的工作量。由此可見(jiàn)由極大線性無(wú)關(guān)組選擇代表性樣品進(jìn)行建模分析可以真正體現(xiàn)近紅外光譜分析具有分析快、成本低、效率高的優(yōu)點(diǎn)且有很好的應(yīng)用價(jià)值。參考文獻(xiàn)[1]McClureWF.AnalyticalChemistry199466(1):43.[2]YANGHai2qingHEYongCHENYong2mingetal(楊海清何勇陳永明等).SpectroscopySpectralAnalysis(光譜

15、學(xué)與光譜分析)200828(6):1232.[3]WANGJia2junLIANGYi2zengWANGFan(王家俊梁逸曾汪帆).ComputersAppliedChemistry(計(jì)算機(jī)與應(yīng)用化學(xué))200623(11):1133.[4]DUANYan2qingWANGJia2junYANGTaoetal(段焰青王家俊楊濤等).Laser&Infared(激光與紅外)200737(10):1058.[5]InonFernoALlari

16、oRafaelGarriguesSalvadetal.AnalyticalBioanalyticalChemistry2005382(7):1549.[6]ChenDaCaiWenshengShaoXueguang.Anal.Bioanal.Chem.2007387:1041.[7]MartinKA.AppliedSpectroscopyReviews199227(4):325.[8]WUJin2guangetal(吳瑾光等).Tech

17、niquesApplicationsofModernFourierTransfmInfraredSpectroscopy(近代傅里葉變換紅外光譜技術(shù)及應(yīng)用上冊(cè)).Beijing:ScientificTechnicalDocumentsPublishingHouse((北京:科學(xué)技術(shù)文獻(xiàn)出版社)1994.251.[9]WANGDong2danLITian2feiWUYu2ping(王東丹李天飛吳玉萍).JournalofYunnanUni

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論