測量不變性（Measurement Invariance）：跨組比較前必做的檢定

學生拿著跨組比較的結果來找我，說：「老師，我比較了男生和女生的 SEM 路徑係數，發現差異很大。」

我問了一個問題：「你有沒有先確認這個量表在男生和女生身上測的是同一個東西？」

他愣了一下。

這就是測量不變性（Measurement Invariance）要解決的問題——在跨組比較之前，你必須先驗證你的測量工具在不同群體裡的意義是否相同。如果沒有做這個檢驗，你的跨組比較在方法上是站不住腳的。

什麼是測量不變性？

假設你用一個動機量表同時測量男生和女生，然後比較兩組的動機分數差異。這個比較有一個前提：這個量表在男生和女生身上「測的是同一個東西」，而且測的方式相同。

如果量表裡的某道題，男生理解的方式和女生理解的方式不同，那你比較出來的「差異」，到底是真實的群體差異，還是量表本身的測量偏誤？你分不清楚。

測量不變性（Measurement Invariance），又稱測量等同性，就是用統計方式驗證：這個量表的因素結構、因素負荷量、截距，在不同群體之間是否相等。只有通過這個驗證，你的跨組比較才有意義。

測量不變性的驗證分四個層次，由寬鬆到嚴格逐步限制，且每一層都建立在前一層成立之上：

形態不變性（Configural Invariance）
驗證：兩組的因素結構相同——哪些題目屬於哪個因素，模式一致。
這是最基本的要求，也是後續所有層次的基礎。
使用時機：確認兩組對量表的基本解讀架構相同，作為後續比較的前提。
測量不變性（Metric Invariance）
在 Configural 基礎上，限制兩組的因素負荷量相等。
意義：題目和潛在因素之間的關係強度在兩組相同。
使用時機：要比較兩組的相關係數或迴歸路徑係數。
⚠️ 達到 Metric 可以比較變項之間的關係，但尚不宜直接比較群體平均數。
截距不變性（Scalar Invariance）
在 Metric 基礎上，進一步限制兩組的題項截距相等。
意義：相同的潛在因素分數，對應的觀察值在兩組相同。
使用時機：要比較兩組的潛在平均數差異——這是最常見的跨組比較目標。
嚴格不變性（Strict Invariance）
在 Scalar 基礎上，進一步限制殘差變異量相等。
意義：測量誤差在兩組也相同。
社會科學研究通常不要求這個層次——達到 Scalar 即可支持多數跨組比較。

測量不變性的驗證用多群組 CFA（Multi-group CFA）來進行，逐步加入約束條件並比較模型配適度。

步驟一：Configural Model（基準模型）
讓兩組各自自由估計所有參數，只限制因素結構相同，作為配適度的基準。

步驟二：Metric Model（限制負荷量相等）
限制兩組因素負荷量相等，比較與 Configural 的配適度變化。

步驟三：Scalar Model（限制截距相等）
進一步限制截距相等，再次比較配適度變化。

判斷標準（ΔCFI / ΔRMSEA 為主，Δχ² 為輔）：

工具：AMOS（多群組分析）、R semTools 套件（measurementInvariance()）、Mplus（MODEL = CONFIGURAL METRIC SCALAR）。

一、跨組比較前完全沒有做這個檢驗

最常見的問題。很多論文的方法段描述了 SEM 配適度，然後直接跳到「男女比較結果」，完全沒有提測量不變性。現在審稿人愈來愈熟悉這個議題，很容易被抓。

我在審稿時看到這種情況，都會要求作者補做不變性檢驗，或者說明為什麼可以假設不變性成立。

二、只用 Δχ² 判斷

Δχ² 的問題是，樣本大（N > 300）時，任何微小差異都會顯著，讓你以為不變性不成立。

⚠️ 學生常見的錯誤：看到 Δχ² 顯著就說「測量不變性不成立」然後放棄比較。其實根據 ΔCFI 可能完全符合不變性標準。現代標準是 ΔCFI 和 ΔRMSEA 為主，Δχ² 報告但不作唯一依據。

三、部分不變性（Partial Invariance）的處理不對

如果 Metric 成立，但 Scalar 不完全成立（只有部分截距相等），叫做部分截距不變性（Partial Scalar Invariance）。

這種情況下仍然可以做有限度的跨組比較，但需要：

⚠️ 學生常見的錯誤：發現兩個截距不等就放棄所有跨組比較。部分不變性不代表什麼都不能比，只是比較範圍和解釋要更謹慎。

四、不知道怎麼報告

測量不變性的報告要用表格呈現四個模型的配適度比較，包含：每個層次的 CFI、RMSEA、SRMR、ΔCFI、ΔRMSEA，以及哪個層次成立的結論。

如果連 Metric Invariance 都不成立，代表這個量表在兩個群體測的是不同的東西：

這不是失敗。很多跨文化研究正是靠測量不變性檢驗，發現了量表在不同群體之間的心理計量差異，進而深化對構念的理解。

如果有問題，歡迎留言。

更新記錄：2026-03 首次發布。