階層線性模式(hierarchical linear modeling,簡稱 HLM)或多層次分析(multilevel analysis)是近幾十年來在教育、社會學、心理學等領域廣泛使用的統計方法。它的核心問題很簡單:當你的資料有巢套結構(nested structure)——也就是「小單位嵌在大單位裡面」——普通的線性迴歸就不夠用了。
為什麼普通迴歸不夠用?
最典型的例子還是從教育研究來看。假設你要研究學生的學習成就,但你手上有來自 30 個班級的資料。問題來了:同一個班的學生共享同一位老師、同樣的教室氣氛、相似的背景環境,他們的學習成就之間自然會有關聯。這違反了普通迴歸的基本假設——觀察值必須彼此獨立。
如果你硬用普通迴歸,就等於忽略了「班級」這個層次的影響。你可以嘗試把班級人數、師生比、老師年資等變數全部丟進去當控制變數,但你永遠控制不完——每個班總有你沒測量到的差異。HLM 的解法是:直接把這種層次結構納入模型,讓資料的巢套性成為分析的一部分,而不是需要「消除」的麻煩。
第二個典型例子是重複測量(repeated measures)。如果你對同一批人進行三次前後測,每個人自己的三次測量就形成了巢套結構——三次觀察「嵌在」同一個人裡面。第一層是不同時間點的測量,第二層是個人本身。如果你不處理這個層次性,統計推論的可靠度就會受到影響。

什麼時候該用 HLM?ICC 是關鍵指標
判斷要不要用 HLM,最常用的標準是組內相關係數(Intraclass Correlation Coefficient,ICC)。ICC 反映的是「整體變異中,有多少比例是來自於上層單位(例如班級)之間的差異」。
一般來說,ICC > 0.05 就值得認真考慮使用 HLM;ICC > 0.10 則通常建議使用。如果你的 ICC 接近 0,代表學生之間的相似性主要不是來自班級效應,用普通迴歸或許還可以接受。
關於如何計算 ICC,可以參考這篇:Stata: 計算 Intraclass Correlation。
Random Intercept vs. Random Slope:用班級例子想清楚
HLM 裡有兩個常讓人困惑的概念。用班級例子來想最直覺:
Random Intercept(隨機截距):每個班的起跑點不一樣。即使你控制了所有學生層次的變數,A 班的整體學習成就平均就是比 B 班高——這個班級間的基準差異,就是截距的隨機效果。
Random Slope(隨機斜率):同一個預測變數,在不同班級對學習成就的影響程度不一樣。比如「課外時間」對成就的影響,在某些班級可能效果很強,在另一些班級卻很微弱——這種班際間斜率的差異,就是斜率的隨機效果。
大多數研究從 random intercept model 開始,確認有班級效應之後,再根據研究問題決定是否進一步加入 random slope。
常用軟體
- HLM 軟體(Raudenbush & Bryk 開發,介面直觀,適合初學者)
- R:lme4 套件(
lmer()函數,靈活度高,學術界廣泛使用) - Stata:xtmixed / mixed 指令(與其他 Stata 分析流程整合方便)
- Mplus(可同時處理 SEM 與 multilevel 模型,適合複雜設計)
延伸閱讀
參考文獻
Hox, J. J., Moerbeek, M., & van de Schoot, R. (2018). Multilevel Analysis: Techniques and Applications (3rd ed.). Routledge.
Raudenbush, S. W., & Bryk, A. S. (2002). Hierarchical linear models: Applications and data analysis methods (2nd ed.). Sage.
Snijders, T. A. B., & Bosker, R. J. (2012). Multilevel Analysis: An Introduction to Basic and Advanced Multilevel Modeling (2nd ed.). Sage.
溫福星(2006)。階層線性模式:原理、方法與應用,臺北:雙葉書廊。
張芳全(2010)。多層次模型在學習成就之研究,臺北:心理出版社。
前者對於理論方面,有較淺顯的文字論述,同時也介紹了如何操作HLM,適合初學者。
後者為研究報告,對於撰寫研究者,可以提供一些想法,同時對於研究結果的論述也可參考。