什麼是階層線性模式 (hierarchical linear modeling)?

researcher20

16 years ago

階層線性模式（hierarchical linear modeling，簡稱 HLM）或多層次分析（multilevel analysis）是近幾十年來在教育、社會學、心理學等領域廣泛使用的統計方法。它的核心問題很簡單：當你的資料有巢套結構（nested structure）——也就是「小單位嵌在大單位裡面」——普通的線性迴歸就不夠用了。

為什麼普通迴歸不夠用？

最典型的例子還是從教育研究來看。假設你要研究學生的學習成就，但你手上有來自 30 個班級的資料。問題來了：同一個班的學生共享同一位老師、同樣的教室氣氛、相似的背景環境，他們的學習成就之間自然會有關聯。這違反了普通迴歸的基本假設——觀察值必須彼此獨立。

如果你硬用普通迴歸，就等於忽略了「班級」這個層次的影響。你可以嘗試把班級人數、師生比、老師年資等變數全部丟進去當控制變數，但你永遠控制不完——每個班總有你沒測量到的差異。HLM 的解法是：直接把這種層次結構納入模型，讓資料的巢套性成為分析的一部分，而不是需要「消除」的麻煩。

第二個典型例子是重複測量（repeated measures）。如果你對同一批人進行三次前後測，每個人自己的三次測量就形成了巢套結構——三次觀察「嵌在」同一個人裡面。第一層是不同時間點的測量，第二層是個人本身。如果你不處理這個層次性，統計推論的可靠度就會受到影響。

什麼時候該用 HLM？ICC 是關鍵指標

判斷要不要用 HLM，最常用的標準是組內相關係數（Intraclass Correlation Coefficient，ICC）。ICC 反映的是「整體變異中，有多少比例是來自於上層單位（例如班級）之間的差異」。

一般來說，ICC > 0.05 就值得認真考慮使用 HLM；ICC > 0.10 則通常建議使用。如果你的 ICC 接近 0，代表學生之間的相似性主要不是來自班級效應，用普通迴歸或許還可以接受。

關於如何計算 ICC，可以參考這篇：Stata: 計算 Intraclass Correlation。

Random Intercept vs. Random Slope：用班級例子想清楚

HLM 裡有兩個常讓人困惑的概念。用班級例子來想最直覺：

Random Intercept（隨機截距）：每個班的起跑點不一樣。即使你控制了所有學生層次的變數，A 班的整體學習成就平均就是比 B 班高——這個班級間的基準差異，就是截距的隨機效果。

Random Slope（隨機斜率）：同一個預測變數，在不同班級對學習成就的影響程度不一樣。比如「課外時間」對成就的影響，在某些班級可能效果很強，在另一些班級卻很微弱——這種班際間斜率的差異，就是斜率的隨機效果。

大多數研究從 random intercept model 開始，確認有班級效應之後，再根據研究問題決定是否進一步加入 random slope。

常用軟體

HLM 軟體（Raudenbush & Bryk 開發，介面直觀，適合初學者）
R：lme4 套件（lmer() 函數，靈活度高，學術界廣泛使用）
Stata：xtmixed / mixed 指令（與其他 Stata 分析流程整合方便）
Mplus（可同時處理 SEM 與 multilevel 模型，適合複雜設計）

參考文獻

Hox, J. J., Moerbeek, M., & van de Schoot, R. (2018). Multilevel Analysis: Techniques and Applications (3rd ed.). Routledge.

Raudenbush, S. W., & Bryk, A. S. (2002). Hierarchical linear models: Applications and data analysis methods (2nd ed.). Sage.

Snijders, T. A. B., & Bosker, R. J. (2012). Multilevel Analysis: An Introduction to Basic and Advanced Multilevel Modeling (2nd ed.). Sage.

為什麼普通迴歸不夠用？

什麼時候該用 HLM？ICC 是關鍵指標

Random Intercept vs. Random Slope：用班級例子想清楚

常用軟體

延伸閱讀

參考文獻