Author name: researcher20

什麼是層次迴歸分析 (hierarchical regression)?

什麼是層次迴歸 Hierarchical Regression?

當你搜尋「層次迴歸」時,維基百科說 Hierarchical linear modeling,Stata 說 Swamy-Arora estimator,統計書又說 hierarchical regression 是一種變數分批進入的方法。這些名詞到底有什麼關係?為什麼會搞混?

簡單來說:這其實是兩種完全不同的東西,只是中文都用了「層次」這個詞。

層次迴歸 = 變數分批進入模型

想像你是一位教育研究者,想預測學生的學業表現。你手上有兩類變數:

  • 控制變數:學生的家庭收入、父母教育程度、性別
  • 研究變數:學生的學習動機

你不希望學習動機的「功勞」被控制變數稀釋,或者想先看控制變數能解釋多少變異,再加入研究變數看看能增加多少解釋力。

這時候你用的是 hierarchical regression——把變數分「階」放入模型,一次一批:

第一階模型:成績 ~ 家庭收入 + 父母教育 + 性別
第二階模型:成績 ~ 家庭收入 + 父母教育 + 性別 + 學習動機

比較:ΔR² 就是學習動機的獨立貢獻

這裡的「層次」指的是變數進入的順序層次,不是資料的結構層次。

用 SPSS 操作時,你會在「Block」欄位分批放入變數,就是這個概念。

HLM = 資料本身有巢套結構

現在換個場景:你想研究學校資源對學生成績的影響。你的資料長這樣:

  • 50 所學校,每所學校 30 位學生
  • 學生(Level 1)巢套在學校(Level 2)之內

這時候問題來了:

  • 同一所學校的學生成績會比較接近(共同的老師、校風、設備)
  • 這違反了一般迴歸「殘差獨立」的假設
  • 如果你跑一般迴歸,標準誤會被低估,容易假性顯著

這時候你需要 Hierarchical Linear Modeling (HLM),多層次線性模式。

HLM 的「層次」指的是資料的階層結構

Level 1: 學生 i 在學校 j 的成績
Level 2: 學校 j 的平均資源水平

學生成績_ij = γ₀₀ + γ₀₁(學校資源_j) + u₀_j + ε_ij

這裡處理的是資料依賴性,不是變數順序。

一張圖看懂如何選擇

決策流程圖:資料有階層結構嗎?

這張圖總結了選擇邏輯:

問題使用方法
想控制變數進入順序,看 incremental R²?層次迴歸
資料有巢套結構(學生→班級→學校)?HLM
只是單純預測,沒有階層也沒有分批需求?一般多元迴歸

常見誤區

「層次迴歸就是多層次模式」

– 錯。前者是變數管理策略,後者是處理資料依賴的統計方法。

「跑 HLM 比較高級,所以我應該用 HLM」

– 錯。如果資料沒有巢套結構,跑 HLM 是多餘的,甚至有過度參數化的風險。

「分批放變數一定要用 SPSS 的 Block 功能」

– 不一定。你可以手動跑多個模型比較 ΔR²,只是 Block 功能幫你省時間。

站內相關文章

若想深入了解,可以參考以下文章:

  • [多層次線性分析方法—HLM軟體應用](/?p=52):HLM6/7

什麼是層次迴歸分析 (hierarchical regression)? Read More »

什麼是階層線性模式 (hierarchical linear modeling)?

階層線性模式(hierarchical linear modeling,簡稱 HLM)或多層次分析(multilevel analysis)是近幾十年來在教育、社會學、心理學等領域廣泛使用的統計方法。它的核心問題很簡單:當你的資料有巢套結構(nested structure)——也就是「小單位嵌在大單位裡面」——普通的線性迴歸就不夠用了。

為什麼普通迴歸不夠用?

最典型的例子還是從教育研究來看。假設你要研究學生的學習成就,但你手上有來自 30 個班級的資料。問題來了:同一個班的學生共享同一位老師、同樣的教室氣氛、相似的背景環境,他們的學習成就之間自然會有關聯。這違反了普通迴歸的基本假設——觀察值必須彼此獨立。

如果你硬用普通迴歸,就等於忽略了「班級」這個層次的影響。你可以嘗試把班級人數、師生比、老師年資等變數全部丟進去當控制變數,但你永遠控制不完——每個班總有你沒測量到的差異。HLM 的解法是:直接把這種層次結構納入模型,讓資料的巢套性成為分析的一部分,而不是需要「消除」的麻煩。

第二個典型例子是重複測量(repeated measures)。如果你對同一批人進行三次前後測,每個人自己的三次測量就形成了巢套結構——三次觀察「嵌在」同一個人裡面。第一層是不同時間點的測量,第二層是個人本身。如果你不處理這個層次性,統計推論的可靠度就會受到影響。

HLM 核心概念一覽:巢套結構、ICC 判斷、Random Intercept、Random Slope、常用軟體
HLM 核心概念一覽

什麼時候該用 HLM?ICC 是關鍵指標

判斷要不要用 HLM,最常用的標準是組內相關係數(Intraclass Correlation Coefficient,ICC)。ICC 反映的是「整體變異中,有多少比例是來自於上層單位(例如班級)之間的差異」。

一般來說,ICC > 0.05 就值得認真考慮使用 HLM;ICC > 0.10 則通常建議使用。如果你的 ICC 接近 0,代表學生之間的相似性主要不是來自班級效應,用普通迴歸或許還可以接受。

關於如何計算 ICC,可以參考這篇:Stata: 計算 Intraclass Correlation

Random Intercept vs.

什麼是階層線性模式 (hierarchical linear modeling)? Read More »

英文論文寫作不求人

讀書心得:英文論文寫作不求人

廖柏森老師的新書:英文寫作不求人,相信大家都已從研究生2.0 之前的文章【講座與贈書活動】英文論文寫作 得知。花了一點時間讀了這本書,這就來跟大家分享心得。

這本書無庸置疑是工具書,或者更準確地說,是幫你整理資源的書。換個角度來看,這本書或許你在讀的時候,你可能會發現你的英文知識並沒有增加,這是正常的,因為你得用了這些工具與資源,才能幫助你提昇英語能力

廖教授所選的網站各個是英語學習中的精品,全書分成四大部分:學術英文寫作網站、線上語料庫網站、自建語料庫與語料庫檢索技巧。

第一部分學術英文寫作網站這部分所介紹的四個網站,幾乎是每個英語老師都會介紹給研究生作參考的。像本站文章如何寫 Cover Letter?

讀書心得:英文論文寫作不求人 Read More »

Qualitative-Research

質化分析步驟

與之前寫的文章:質化研究分析技巧(一):Pattern matching質化研究分析策略 不同,此篇質化分析步驟是 Merriam (2009) 所提供一步一步的指引,對於入門者來說挺有幫助的,所以在此記錄下來。

在分析之前,要先了解質化分析的目的。Merriam (2009) 認為「質化分析的目的是從資料中找出有意義的過程」(頁175) (Data analysis is the process of making sense out of the data),而分析的主要方式不外乎是歸納 (inductive) 與比較 (comparative)。分析就是在眾多資料之中找出所有有意義的片段,而這些片段是可以回答你的研究問題的。

那如何作呢?Merriam (2009) 提出了五個步驟:category construction、sorting categories and data、naming the categories、how many categories、becoming more theoretical。

Category construction 類別建置

這個過程是在你閱讀第一份質化資料的時候開始。當你在閱讀的過程中,你會作些筆記和評論,這些有趣的地方可能就是你研究的重點。這個類別建置的過程,也有人稱為編碼 (coding)。因為是一開始分析,所以你會儘可能的為每段有用資料都編碼。因為你採取了一個較為開放的態度,這種編碼方式稱為開放性編碼 (open coding)。

在編碼的過程中,你可能會結合數個類別成為一個新的類別,這種方式稱為主軸性編碼 (axial coding) 或分析性編碼 (analytic coding)。當你編碼完第一份資料時,再進行到下一份資料。如果你不是用像 NVivo、HyperResearch 或 Atlas.ti

質化分析步驟 Read More »

NVivo 教學:資料編碼 (coding)

NVivo 提供了多種編碼 (coding) 的方式,但基本概念都是用節點 (nodes) 的方式來達成節點可以想成是一個類別 (category),也就是你基本的編碼。NVivo 提供 free nodes 和 tree nodes 兩種模式,最大的區別就是前者沒有樹狀階層,而後者有。所以依照 Merriam (2009) 的建議,初步分析,也就 category construction 這個階段,我會使用 free nodes 來進行快速分類。如果分類底下的內容愈來愈多,我就會試著依照文獻和我的研究問題,將我的 free nodes 轉換成 tree nodes,更方便我組織想法

1.png

Free nodes 沒什麼好說的,在你的資料裡,將你要 coding 的地方選起來,按右鍵選擇 code selection,之後看你的類別選取是已存在的 nodes 還是新 nodes。

3.png

所以整體畫面看起來就如下圖。

2.png

Tree nodes 比較麻煩,要先建立 nodes 或是從 free nodes 移過去才行。coding 的步驟與 free nodes 相同,便不再多說。

4.png

最後在跟大家分享一個我在 NVivo 的設置。在 NVivo 裡,如果你要用 tree nodes,常常會顯得空間不夠,要捲上捲下才能作 coding。此外,coding 是按右鍵來選 code 的方式也不是很有效率。

5.png

我的作法是將版面配置稍作修改,從 coding 在上、內容在下改變成 coding 在左、內容在右。這樣的好處有二:1) 儘可能顯現出較多的 codes;2) 在 coding 時,方便你用 drag and drop 的方式。

6.png

改成左右欄之後如下圖,我選取好要 coding 的部分,用拖放到 tree nodes,會比按右鍵選取來得省事。

7.png

如果有人有更好的方法,還請不吝分享~

參考書目

Merriam, S.…

NVivo 教學:資料編碼 (coding) Read More »

Scroll to Top