一般彩色影像,每個像素只有 3 個數字(紅綠藍)。
高光譜影像則是一個資料立方體:兩個空間維度 + 第三個維度的數百個連續波段。
從任何一個像素,都能取出一條完整的光譜曲線——那就是那個位置的化學指紋。
1028 筆 Vis-近紅外光譜 + 乾物質含量
真實資料總是有點「髒」——清理它,是分析的第一步。
左:四食材原始反射光譜(平均±標準差),形狀各異=指紋。 右:SNV 標準常態變量標準化後,消除表面散射、量測距離造成的平移,凸顯真正的化學差異。
141 個波段高度相關。主成分分析 PCA 後,前兩個主成分就抓住 94.6% 變異。把 PC1-PC2 畫成散布圖,四種食材自動分成四群——還沒分類,資料自己就攤牌了。
測試集 257 筆,對角線全中、零誤分。
⚠️ 別急著高興:四種食材差異這麼大,100% 代表這題太簡單了。
真正困難、更有價值的,是下一個任務——定量預測。
韭蔥完整光譜(含 NIR 至 1717nm),10-fold 交叉驗證,RMSE 僅 0.96%。
定性「是哪種」容易;定量「含多少」才難。
近紅外能感應水分與有機物吸收——這正是真實食品品管在用的技術。
開源 Orange Data Mining + Spectroscopy 外掛:用滑鼠把 widget 連起來——讀檔 → 預處理光譜 → PCA / PLS / 分類 → 測試評分 → 混淆矩陣。同樣的科學,零程式碼。