學生拿著跨組比較的結果來找我,說:「老師,我比較了男生和女生的 SEM 路徑係數,發現差異很大。」
我問了一個問題:「你有沒有先確認這個量表在男生和女生身上測的是同一個東西?」
他愣了一下。
這就是測量不變性(Measurement Invariance)要解決的問題——在跨組比較之前,你必須先驗證你的測量工具在不同群體裡的意義是否相同。如果沒有做這個檢驗,你的跨組比較在方法上是站不住腳的。
什麼是測量不變性?
假設你用一個動機量表同時測量男生和女生,然後比較兩組的動機分數差異。這個比較有一個前提:這個量表在男生和女生身上「測的是同一個東西」,而且測的方式相同。
如果量表裡的某道題,男生理解的方式和女生理解的方式不同,那你比較出來的「差異」,到底是真實的群體差異,還是量表本身的測量偏誤?你分不清楚。
測量不變性(Measurement Invariance),又稱測量等同性,就是用統計方式驗證:這個量表的因素結構、因素負荷量、截距,在不同群體之間是否相等。只有通過這個驗證,你的跨組比較才有意義。
測量不變性的四個層次

測量不變性的驗證分四個層次,由寬鬆到嚴格逐步限制,且每一層都建立在前一層成立之上:
-
形態不變性(Configural Invariance)
驗證:兩組的因素結構相同——哪些題目屬於哪個因素,模式一致。
這是最基本的要求,也是後續所有層次的基礎。
使用時機:確認兩組對量表的基本解讀架構相同,作為後續比較的前提。 -
測量不變性(Metric Invariance)
在 Configural 基礎上,限制兩組的因素負荷量相等。
意義:題目和潛在因素之間的關係強度在兩組相同。
使用時機:要比較兩組的相關係數或迴歸路徑係數。
⚠️ 達到 Metric 可以比較變項之間的關係,但尚不宜直接比較群體平均數。 -
截距不變性(Scalar Invariance)
在 Metric 基礎上,進一步限制兩組的題項截距相等。
意義:相同的潛在因素分數,對應的觀察值在兩組相同。
使用時機:要比較兩組的潛在平均數差異——這是最常見的跨組比較目標。 -
嚴格不變性(Strict Invariance)
在 Scalar 基礎上,進一步限制殘差變異量相等。
意義:測量誤差在兩組也相同。
社會科學研究通常不要求這個層次——達到 Scalar 即可支持多數跨組比較。
如何進行測量不變性檢驗?
測量不變性的驗證用多群組 CFA(Multi-group CFA)來進行,逐步加入約束條件並比較模型配適度。
步驟一:Configural Model(基準模型)
讓兩組各自自由估計所有參數,只限制因素結構相同,作為配適度的基準。
步驟二:Metric Model(限制負荷量相等)
限制兩組因素負荷量相等,比較與 Configural 的配適度變化。
步驟三:Scalar Model(限制截距相等)
進一步限制截距相等,再次比較配適度變化。
判斷標準(ΔCFI / ΔRMSEA 為主,Δχ² 為輔):
- 常用判準:ΔCFI ≤ .010,且 ΔRMSEA ≤ .015
- 不建議只依賴 Δχ²——Δχ² 對樣本數敏感,大樣本時幾乎必然顯著,容易誤判。
工具:AMOS(多群組分析)、R semTools 套件(measurementInvariance())、Mplus(MODEL = CONFIGURAL METRIC SCALAR)。
容易犯錯的地方
一、跨組比較前完全沒有做這個檢驗
最常見的問題。很多論文的方法段描述了 SEM 配適度,然後直接跳到「男女比較結果」,完全沒有提測量不變性。現在審稿人愈來愈熟悉這個議題,很容易被抓。
我在審稿時看到這種情況,都會要求作者補做不變性檢驗,或者說明為什麼可以假設不變性成立。
二、只用 Δχ² 判斷
Δχ² 的問題是,樣本大(N > 300)時,任何微小差異都會顯著,讓你以為不變性不成立。
⚠️ 學生常見的錯誤:看到 Δχ² 顯著就說「測量不變性不成立」然後放棄比較。其實根據 ΔCFI 可能完全符合不變性標準。現代標準是 ΔCFI 和 ΔRMSEA 為主,Δχ² 報告但不作唯一依據。
三、部分不變性(Partial Invariance)的處理不對
如果 Metric 成立,但 Scalar 不完全成立(只有部分截距相等),叫做部分截距不變性(Partial Scalar Invariance)。
這種情況下仍然可以做有限度的跨組比較,但需要:
- 確認哪些題項的截距不等(用 MI 找出),並說明原因
- 以不變的題項作為錨點(anchor)
- 在限制段說明部分不變性對結論的影響
⚠️ 學生常見的錯誤:發現兩個截距不等就放棄所有跨組比較。部分不變性不代表什麼都不能比,只是比較範圍和解釋要更謹慎。
四、不知道怎麼報告
測量不變性的報告要用表格呈現四個模型的配適度比較,包含:每個層次的 CFI、RMSEA、SRMR、ΔCFI、ΔRMSEA,以及哪個層次成立的結論。
不變性不成立怎麼辦?
如果連 Metric Invariance 都不成立,代表這個量表在兩個群體測的是不同的東西:
- 先找出哪些題項的負荷量不等(MI 定位),看看是否有文化或語言差異
- 考慮量表是否需要修改,或分組建立不同測量模型
- 在論文裡誠實說明:量表在兩個群體有不同的心理計量特性,跨組比較有限制
這不是失敗。很多跨文化研究正是靠測量不變性檢驗,發現了量表在不同群體之間的心理計量差異,進而深化對構念的理解。
如果有問題,歡迎留言。
更新記錄:2026-03 首次發布。