研究生2.0

什麼是階層線性模式 (hierarchical linear modeling)?

階層線性模式(hierarchical linear modeling,簡稱 HLM)或多層次分析(multilevel analysis)是近幾十年來在教育、社會學、心理學等領域廣泛使用的統計方法。它的核心問題很簡單:當你的資料有巢套結構(nested structure)——也就是「小單位嵌在大單位裡面」——普通的線性迴歸就不夠用了。

為什麼普通迴歸不夠用?

最典型的例子還是從教育研究來看。假設你要研究學生的學習成就,但你手上有來自 30 個班級的資料。問題來了:同一個班的學生共享同一位老師、同樣的教室氣氛、相似的背景環境,他們的學習成就之間自然會有關聯。這違反了普通迴歸的基本假設——觀察值必須彼此獨立。

如果你硬用普通迴歸,就等於忽略了「班級」這個層次的影響。你可以嘗試把班級人數、師生比、老師年資等變數全部丟進去當控制變數,但你永遠控制不完——每個班總有你沒測量到的差異。HLM 的解法是:直接把這種層次結構納入模型,讓資料的巢套性成為分析的一部分,而不是需要「消除」的麻煩。

第二個典型例子是重複測量(repeated measures)。如果你對同一批人進行三次前後測,每個人自己的三次測量就形成了巢套結構——三次觀察「嵌在」同一個人裡面。第一層是不同時間點的測量,第二層是個人本身。如果你不處理這個層次性,統計推論的可靠度就會受到影響。

HLM 核心概念一覽

什麼時候該用 HLM?ICC 是關鍵指標

判斷要不要用 HLM,最常用的標準是組內相關係數(Intraclass Correlation Coefficient,ICC)。ICC 反映的是「整體變異中,有多少比例是來自於上層單位(例如班級)之間的差異」。

一般來說,ICC > 0.05 就值得認真考慮使用 HLM;ICC > 0.10 則通常建議使用。如果你的 ICC 接近 0,代表學生之間的相似性主要不是來自班級效應,用普通迴歸或許還可以接受。

關於如何計算 ICC,可以參考這篇:Stata: 計算 Intraclass Correlation

Random Intercept vs. Random Slope:用班級例子想清楚

HLM 裡有兩個常讓人困惑的概念。用班級例子來想最直覺:

Random Intercept(隨機截距):每個班的起跑點不一樣。即使你控制了所有學生層次的變數,A 班的整體學習成就平均就是比 B 班高——這個班級間的基準差異,就是截距的隨機效果。

Random Slope(隨機斜率):同一個預測變數,在不同班級對學習成就的影響程度不一樣。比如「課外時間」對成就的影響,在某些班級可能效果很強,在另一些班級卻很微弱——這種班際間斜率的差異,就是斜率的隨機效果。

大多數研究從 random intercept model 開始,確認有班級效應之後,再根據研究問題決定是否進一步加入 random slope。

常用軟體

延伸閱讀

參考文獻

Hox, J. J., Moerbeek, M., & van de Schoot, R. (2018). Multilevel Analysis: Techniques and Applications (3rd ed.). Routledge.

Raudenbush, S. W., & Bryk, A. S. (2002). Hierarchical linear models: Applications and data analysis methods (2nd ed.). Sage.

Snijders, T. A. B., & Bosker, R. J. (2012). Multilevel Analysis: An Introduction to Basic and Advanced Multilevel Modeling (2nd ed.). Sage.

Exit mobile version