使用多變量分析來分析礦泉水
近年來多變量分析經常用於化學測量領域,以定量分析混合物或用於分類多重樣品。使用多變量分析可更輕易定量混合物樣品內的目標成分含量,並分類大量樣品。本文說明利用 UV 範圍內之礦泉水特有吸收光譜,使用多變量分析進行多種分析。
1 多變量分析概述
多變量分析是一種統計分析多組分析資料的技術,以提供使用先前資料分析方法無法取得的資訊。用於化學測量領域時,有時候稱為化學計量學。
多變量分析包含多種技術,但這些可歸類為定量方法或分類方法。
定量方法包括複迴歸 (多重線性迴歸 (MLR) 或反最小平方 (ILS))、主成分迴歸 (PCR) 和部分最小平方 (PLS)。使用此類技術可在含混合成分的樣品中,決定每個成分 (或目標成分) 的數量。複迴歸需要分析師選擇特定資料 (敘述變項),但使用 PCR 和 PLS 技術則否,可以使用所有資料。不過 PCR 和 PLS 比起複迴歸,較容易受到雜訊 (資料變異性) 影響。分類方法包括主成分分析 (PCA)、集群分析、辨別分析和因素分析。使用此類技術可以依據相似性分類多重樣品,以瞭解其特性或協助識別其產於何處。圖 1 顯示多變項分析概述。本文中選擇複迴歸做為定量方法,並選擇主成分分析 (PCA) 和集群分析做為分類方法,以舉例說明多變項分析。
2 使用複迴歸同時定量礦泉水混合樣品
複迴歸可在含混合成分的樣品中,決定每個成分 (或目標成分) 的數量。在這個範例中,三種市售礦泉水品牌 A、B 和 C 以不同比例混合,然後使用複迴歸決定每份樣品的混合比例。首先使用以不同混合比例製備的標準樣品,建立一個校正模型。製備具有已知混合比的樣品以驗證校正模型。使用 UV-3600 UV-VIS-NIR 分光光譜儀,測量九份標準樣品和三份驗證樣品的 UV 吸收光譜。使用具有 10 mm 光徑長度的水晶槽,並以離子交換水做為參考,測量每種品牌礦泉水的吸收光譜,如圖 2 所示。標準和驗證樣品的混合比,如表 1 和 2 所示。測量這些結果得到的結果如圖 3 (標準樣品 ① 至 ⑤)、圖 4 (標準樣品 ⑥ 至 ⑨) 和圖 5 (驗證樣品 ① 至 ③) 所示。
使用四種吸收波長:200 nm、205 nm、210 nm 和 215 nm 下的,為每種礦泉水建立校正模型 (複迴歸)。(1) 每個模型的複迴歸方程式如表 3 所示。礦泉水 A、B 和 C 的校正模型之複相關係數分別為 0.999921、0.999986 和 0.999973。
複相關係數表示實際和預測之測量值之間的相關性,其中預測值以複迴歸方程式計算。每份樣品的混合比計算方式為,將複迴歸方程式中的吸光度,替換為從四個波長下之驗證樣品取得的吸光度值。定量分析結果如表 4 所示。表 2 中的比較顯示可取得良好結果。複迴歸模型能夠利用來自多個波長的吸光度,對於多種成分的同時定量分析特別有用,如本範例所示。
3 使用主成分分析 (PCA) 之礦泉水分類
以下說明使用主成分分析 (PCA) 之範例。圖 6 至圖 8 顯示 19 份礦泉水樣品和一份自來水樣品的總計 20 個吸收光譜 (至 T)。
使用主成分分析來分析這 20 個光譜。(2) 分析中使用 190 nm 至 230 nm 測量範圍中取得的所有資料。取得分數圖如圖 9 所示。分數圖顯示在座標平面上繪製,對應至主成分第 1 群和第 2 群的分數,得出圖上繪製對應至測量樣品的 20 個點。水平軸對應至第 1 群主成分,垂直軸對應至第 2 群主成分。在這個情況下,「主成分」代表以數學項指派的某類特性。其表示主成分繪製位置彼此較接近的樣品,較相似。圖 10 顯示圈選範圍內樣品的光譜,顯示同一群內的光譜非常相近。
圖 11 顯示沿著水平軸 (第 1 群主成分) 選定點上,對應至繪製點的光譜。同樣的,圖 12 顯示水平軸 (第 2 群主成分) 上選定繪製點的光譜。假定水平軸對應至總吸收 (光譜面積),而垂直軸對應至光譜形狀 (依據光譜中心附近是否有一個突起)。(此假設的有效性可透過檢視稱為負荷圖的圖表確認,在此省略其說明。) 總吸收值可能對應至溶於樣品中的總離子和其他項目,而光譜形狀可能對應至離子類型等等。透過分析多重樣品的主成分,可用目視方式瞭解樣品之間的相似性。
4 使用集群分析分類礦泉水
集群分析是和主成分分析 (PCA) 不同的一種分類方法,可以透過使用樹狀圖畫出類似樣品的階層,以呈現所有樣品。針對上述 20 種礦泉水,圖 13 顯示來自集群分析的結果。(3) 在這個範例中,使用 Ward 法進行集群分析計算。圖 13 顯示集群圖和 PCA。顯示集群分析如何提供和 PCA 相似的結果。樹狀圖可用於瞭解資料和集群之間的相似性。
5 總結
本文說明如何使用複迴歸,同時定量三種礦泉水的混合物。也說明使用主成分分析,以分數圖呈現 20 種礦泉水的特性,也說明使用集群分析,在樹狀圖中進一步彙整特性。
這些分類方法可透過目視方式瞭解樣品之間的相似性。除了上述分析範例以外,多變量分析也用於多種其他情況。例如,多變量分析可用於掃描橘子、蘋果和其他水果的簡單光譜儀,以測量其糖分和酸度。也可用於其他許多應用,例如識別蔬菜產地、分類氣味、評估化妝品的有效性,以及測量魚類的脂肪含量。應用領域也非常多樣化,且包括食品、化學品、生命科學、藥品、電氣和半導體。由於有許多方式可用於檢視分析資料,未來多變項分析無疑仍會持續廣泛使用。
(1) 使用 Excel® 試算表軟體計算。Excel 為 Microsoft Corporation 的註冊商標。
(2) 和 (3) 使用 The Unscrambler® 多變量分析軟體計算。The Unscrambler 為 CAMO Software 的註冊商標。