測量不變性(Measurement Invariance):跨組比較前必做的檢定

學生拿著跨組比較的結果來找我,說:「老師,我比較了男生和女生的 SEM 路徑係數,發現差異很大。」

我問了一個問題:「你有沒有先確認這個量表在男生和女生身上測的是同一個東西?」

他愣了一下。

這就是測量不變性(Measurement Invariance)要解決的問題——在跨組比較之前,你必須先驗證你的測量工具在不同群體裡的意義是否相同。如果沒有做這個檢驗,你的跨組比較在方法上是站不住腳的。

什麼是測量不變性?

假設你用一個動機量表同時測量男生和女生,然後比較兩組的動機分數差異。這個比較有一個前提:這個量表在男生和女生身上「測的是同一個東西」,而且測的方式相同。

如果量表裡的某道題,男生理解的方式和女生理解的方式不同,那你比較出來的「差異」,到底是真實的群體差異,還是量表本身的測量偏誤?你分不清楚。

測量不變性(Measurement Invariance),又稱測量等同性,就是用統計方式驗證:這個量表的因素結構、因素負荷量、截距,在不同群體之間是否相等。只有通過這個驗證,你的跨組比較才有意義。

測量不變性的四個層次

測量不變性四層次:Configural / Metric / Scalar / Strict
測量不變性四層次——哪個層次才夠用?(需依序通過每一層)

測量不變性的驗證分四個層次,由寬鬆到嚴格逐步限制,且每一層都建立在前一層成立之上

  1. 形態不變性(Configural Invariance)
    驗證:兩組的因素結構相同——哪些題目屬於哪個因素,模式一致。
    這是最基本的要求,也是後續所有層次的基礎。
    使用時機:確認兩組對量表的基本解讀架構相同,作為後續比較的前提。
  2. 測量不變性(Metric Invariance)
    在 Configural 基礎上,限制兩組的因素負荷量相等。
    意義:題目和潛在因素之間的關係強度在兩組相同。
    使用時機:要比較兩組的相關係數或迴歸路徑係數。
    ⚠️ 達到 Metric 可以比較變項之間的關係,但尚不宜直接比較群體平均數
  3. 截距不變性(Scalar Invariance)
    在 Metric 基礎上,進一步限制兩組的題項截距相等。
    意義:相同的潛在因素分數,對應的觀察值在兩組相同。
    使用時機:要比較兩組的潛在平均數差異——這是最常見的跨組比較目標。
  4. 嚴格不變性(Strict Invariance)
    在 Scalar 基礎上,進一步限制殘差變異量相等。
    意義:測量誤差在兩組也相同。
    社會科學研究通常不要求這個層次——達到 Scalar 即可支持多數跨組比較。

如何進行測量不變性檢驗?

測量不變性的驗證用多群組 CFA(Multi-group CFA)來進行,逐步加入約束條件並比較模型配適度。

步驟一:Configural Model(基準模型)
讓兩組各自自由估計所有參數,只限制因素結構相同,作為配適度的基準。

步驟二:Metric Model(限制負荷量相等)
限制兩組因素負荷量相等,比較與 Configural 的配適度變化。

步驟三:Scalar Model(限制截距相等)
進一步限制截距相等,再次比較配適度變化。

判斷標準(ΔCFI / ΔRMSEA 為主,Δχ² 為輔):

  • 常用判準:ΔCFI ≤ .010,且 ΔRMSEA ≤ .015
  • 不建議只依賴 Δχ²——Δχ² 對樣本數敏感,大樣本時幾乎必然顯著,容易誤判。

工具:AMOS(多群組分析)、R semTools 套件(measurementInvariance())、Mplus(MODEL = CONFIGURAL METRIC SCALAR)。

容易犯錯的地方

一、跨組比較前完全沒有做這個檢驗

最常見的問題。很多論文的方法段描述了 SEM 配適度,然後直接跳到「男女比較結果」,完全沒有提測量不變性。現在審稿人愈來愈熟悉這個議題,很容易被抓。

我在審稿時看到這種情況,都會要求作者補做不變性檢驗,或者說明為什麼可以假設不變性成立。

二、只用 Δχ² 判斷

Δχ² 的問題是,樣本大(N > 300)時,任何微小差異都會顯著,讓你以為不變性不成立。

⚠️ 學生常見的錯誤:看到 Δχ² 顯著就說「測量不變性不成立」然後放棄比較。其實根據 ΔCFI 可能完全符合不變性標準。現代標準是 ΔCFI 和 ΔRMSEA 為主,Δχ² 報告但不作唯一依據。

三、部分不變性(Partial Invariance)的處理不對

如果 Metric 成立,但 Scalar 不完全成立(只有部分截距相等),叫做部分截距不變性(Partial Scalar Invariance)

這種情況下仍然可以做有限度的跨組比較,但需要:

  • 確認哪些題項的截距不等(用 MI 找出),並說明原因
  • 以不變的題項作為錨點(anchor)
  • 在限制段說明部分不變性對結論的影響

⚠️ 學生常見的錯誤:發現兩個截距不等就放棄所有跨組比較。部分不變性不代表什麼都不能比,只是比較範圍和解釋要更謹慎。

四、不知道怎麼報告

測量不變性的報告要用表格呈現四個模型的配適度比較,包含:每個層次的 CFI、RMSEA、SRMR、ΔCFI、ΔRMSEA,以及哪個層次成立的結論。

不變性不成立怎麼辦?

如果連 Metric Invariance 都不成立,代表這個量表在兩個群體測的是不同的東西:

  • 先找出哪些題項的負荷量不等(MI 定位),看看是否有文化或語言差異
  • 考慮量表是否需要修改,或分組建立不同測量模型
  • 在論文裡誠實說明:量表在兩個群體有不同的心理計量特性,跨組比較有限制

這不是失敗。很多跨文化研究正是靠測量不變性檢驗,發現了量表在不同群體之間的心理計量差異,進而深化對構念的理解。

如果有問題,歡迎留言。

更新記錄:2026-03 首次發布。

Leave a Comment

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Scroll to Top