20 世紀70 年代以來, 化學計量學方法與計算機技術的結合使得人們不僅可以根據紅外、近紅外、核磁等光譜信息進行物質結構鑒定, 而且可以根據標準品的光譜和相關定量、定性信息建立數學模型、實現對未知樣品的定量與定性分析 。信號弱、沒有典型的吸收特征峰而被長期忽視的近紅外光譜也在各個領域的定量、定性分析中得到了廣泛應用。在中藥、煙草等天然產物領域, 運用紅外、近紅外光譜信息進行樣品的產地、道地性的模式識別工作有很多 。但目前對于更為精細的植物部位( 如煙葉部位) 的識別研究尚很少見, 而在中藥材、煙葉的質量管理中, 部位的劃分和識別是十分重要的。
文獻的研究表明對于傅里葉近紅外光譜, 采用一階導數光譜可以取得的產地識別結果, 故本文對2003 年和2005 年單一產地的煙葉樣本的紅外和近紅外譜圖經過一階導數處理后, 均勻、輪流選取樣本集的四分之一作為檢驗集, 令模型參數, 取不同區間光譜進行煙葉上中下部位預測。
本文利用紅外光譜和近紅外光譜信息進行煙葉部位的識別, 以探索這類光譜信息是否能夠區分更為細微的植物部位差異, 并探討了模式識別模型中有關參數( 如光譜區間、光譜預處理方法等) 對判別結果的影響。本文采用文獻提出的基于光譜主成分分析( PCA) 與馬氏距離的判別分析模型進行煙葉上、中、下部位的識別, 樣品光譜距哪個部位的類中心距離zui小就屬于哪個部位。由于主成分個數的選擇無法事先確定, 主成分取得過多會引入不必要的噪聲并造成過擬合( 即建模效果很好但預測效果很差) , 而取得過少會丟失重要的信息。