Author name: researcher20

Stata: 如何作層次迴歸分析(hierarchical regression)?

Stata 並沒有內建層次分析 (hierarchial regression) 的指令(註),所以要先進行安裝

net describe hireg, from(http://fmwww.bc.edu/RePEc/bocode/h) <br />net install hireg

之後如果要執行指令,就像下方一樣:

hireg dv (a)(b) (c) (d) ,nomiss

dv 是 dependent variable,後方一個()就是一個 model,所以有四個表示有四個models。跑完之後,Stata 會告訴你這些 models之間是不是有顯著差異,以及 R-square 的變化。

1.png

註:如果是要作 stepwise regression 的話,可以用Stata 內建的 stepwise 指令來使用。雖然裡面有 forward 和 backward hierarchial 的選項,但畢竟沒 hireg 這個指令好用。…

Stata: 如何作層次迴歸分析(hierarchical regression)? Read More »

什麼是層次迴歸分析 (hierarchical regression)?

什麼是層次迴歸 Hierarchical Regression?

當你搜尋「層次迴歸」時,維基百科說 Hierarchical linear modeling,Stata 說 Swamy-Arora estimator,統計書又說 hierarchical regression 是一種變數分批進入的方法。這些名詞到底有什麼關係?為什麼會搞混?

簡單來說:這其實是兩種完全不同的東西,只是中文都用了「層次」這個詞。

層次迴歸 = 變數分批進入模型

想像你是一位教育研究者,想預測學生的學業表現。你手上有兩類變數:

  • 控制變數:學生的家庭收入、父母教育程度、性別
  • 研究變數:學生的學習動機

你不希望學習動機的「功勞」被控制變數稀釋,或者想先看控制變數能解釋多少變異,再加入研究變數看看能增加多少解釋力。

這時候你用的是 hierarchical regression——把變數分「階」放入模型,一次一批:

第一階模型:成績 ~ 家庭收入 + 父母教育 + 性別
第二階模型:成績 ~ 家庭收入 + 父母教育 + 性別 + 學習動機

比較:ΔR² 就是學習動機的獨立貢獻

這裡的「層次」指的是變數進入的順序層次,不是資料的結構層次。

用 SPSS 操作時,你會在「Block」欄位分批放入變數,就是這個概念。

HLM = 資料本身有巢套結構

現在換個場景:你想研究學校資源對學生成績的影響。你的資料長這樣:

  • 50 所學校,每所學校 30 位學生
  • 學生(Level 1)巢套在學校(Level 2)之內

這時候問題來了:

  • 同一所學校的學生成績會比較接近(共同的老師、校風、設備)
  • 這違反了一般迴歸「殘差獨立」的假設
  • 如果你跑一般迴歸,標準誤會被低估,容易假性顯著

這時候你需要 Hierarchical Linear Modeling (HLM),多層次線性模式。

HLM 的「層次」指的是資料的階層結構

Level 1: 學生 i 在學校 j 的成績
Level 2: 學校 j 的平均資源水平

學生成績_ij = γ₀₀ + γ₀₁(學校資源_j) + u₀_j + ε_ij

這裡處理的是資料依賴性,不是變數順序。

一張圖看懂如何選擇

決策流程圖:資料有階層結構嗎?

這張圖總結了選擇邏輯:

問題使用方法
想控制變數進入順序,看 incremental R²?層次迴歸
資料有巢套結構(學生→班級→學校)?HLM
只是單純預測,沒有階層也沒有分批需求?一般多元迴歸

常見誤區

「層次迴歸就是多層次模式」

– 錯。前者是變數管理策略,後者是處理資料依賴的統計方法。

「跑 HLM 比較高級,所以我應該用 HLM」

– 錯。如果資料沒有巢套結構,跑 HLM 是多餘的,甚至有過度參數化的風險。

「分批放變數一定要用 SPSS 的 Block 功能」

– 不一定。你可以手動跑多個模型比較 ΔR²,只是 Block 功能幫你省時間。

站內相關文章

若想深入了解,可以參考以下文章:

  • [多層次線性分析方法—HLM軟體應用](/?p=52):HLM6/7

什麼是層次迴歸分析 (hierarchical regression)? Read More »

什麼是階層線性模式 (hierarchical linear modeling)?

階層線性模式(hierarchical linear modeling,簡稱 HLM)或多層次分析(multilevel analysis)是近幾十年來在教育、社會學、心理學等領域廣泛使用的統計方法。它的核心問題很簡單:當你的資料有巢套結構(nested structure)——也就是「小單位嵌在大單位裡面」——普通的線性迴歸就不夠用了。

為什麼普通迴歸不夠用?

最典型的例子還是從教育研究來看。假設你要研究學生的學習成就,但你手上有來自 30 個班級的資料。問題來了:同一個班的學生共享同一位老師、同樣的教室氣氛、相似的背景環境,他們的學習成就之間自然會有關聯。這違反了普通迴歸的基本假設——觀察值必須彼此獨立。

如果你硬用普通迴歸,就等於忽略了「班級」這個層次的影響。你可以嘗試把班級人數、師生比、老師年資等變數全部丟進去當控制變數,但你永遠控制不完——每個班總有你沒測量到的差異。HLM 的解法是:直接把這種層次結構納入模型,讓資料的巢套性成為分析的一部分,而不是需要「消除」的麻煩。

第二個典型例子是重複測量(repeated measures)。如果你對同一批人進行三次前後測,每個人自己的三次測量就形成了巢套結構——三次觀察「嵌在」同一個人裡面。第一層是不同時間點的測量,第二層是個人本身。如果你不處理這個層次性,統計推論的可靠度就會受到影響。

HLM 核心概念一覽:巢套結構、ICC 判斷、Random Intercept、Random Slope、常用軟體
HLM 核心概念一覽

什麼時候該用 HLM?ICC 是關鍵指標

判斷要不要用 HLM,最常用的標準是組內相關係數(Intraclass Correlation Coefficient,ICC)。ICC 反映的是「整體變異中,有多少比例是來自於上層單位(例如班級)之間的差異」。

一般來說,ICC > 0.05 就值得認真考慮使用 HLM;ICC > 0.10 則通常建議使用。如果你的 ICC 接近 0,代表學生之間的相似性主要不是來自班級效應,用普通迴歸或許還可以接受。

關於如何計算 ICC,可以參考這篇:Stata: 計算 Intraclass Correlation

Random Intercept vs.

什麼是階層線性模式 (hierarchical linear modeling)? Read More »

英文論文寫作不求人

讀書心得:英文論文寫作不求人

廖柏森老師的新書:英文寫作不求人,相信大家都已從研究生2.0 之前的文章【講座與贈書活動】英文論文寫作 得知。花了一點時間讀了這本書,這就來跟大家分享心得。

這本書無庸置疑是工具書,或者更準確地說,是幫你整理資源的書。換個角度來看,這本書或許你在讀的時候,你可能會發現你的英文知識並沒有增加,這是正常的,因為你得用了這些工具與資源,才能幫助你提昇英語能力

廖教授所選的網站各個是英語學習中的精品,全書分成四大部分:學術英文寫作網站、線上語料庫網站、自建語料庫與語料庫檢索技巧。

第一部分學術英文寫作網站這部分所介紹的四個網站,幾乎是每個英語老師都會介紹給研究生作參考的。像本站文章如何寫 Cover Letter?

讀書心得:英文論文寫作不求人 Read More »

Qualitative-Research

質化分析步驟

與之前寫的文章:質化研究分析技巧(一):Pattern matching質化研究分析策略 不同,此篇質化分析步驟是 Merriam (2009) 所提供一步一步的指引,對於入門者來說挺有幫助的,所以在此記錄下來。

在分析之前,要先了解質化分析的目的。Merriam (2009) 認為「質化分析的目的是從資料中找出有意義的過程」(頁175) (Data analysis is the process of making sense out of the data),而分析的主要方式不外乎是歸納 (inductive) 與比較 (comparative)。分析就是在眾多資料之中找出所有有意義的片段,而這些片段是可以回答你的研究問題的。

那如何作呢?Merriam (2009) 提出了五個步驟:category construction、sorting categories and data、naming the categories、how many categories、becoming more theoretical。

Category construction 類別建置

這個過程是在你閱讀第一份質化資料的時候開始。當你在閱讀的過程中,你會作些筆記和評論,這些有趣的地方可能就是你研究的重點。這個類別建置的過程,也有人稱為編碼 (coding)。因為是一開始分析,所以你會儘可能的為每段有用資料都編碼。因為你採取了一個較為開放的態度,這種編碼方式稱為開放性編碼 (open coding)。

在編碼的過程中,你可能會結合數個類別成為一個新的類別,這種方式稱為主軸性編碼 (axial coding) 或分析性編碼 (analytic coding)。當你編碼完第一份資料時,再進行到下一份資料。如果你不是用像 NVivo、HyperResearch 或 Atlas.ti

質化分析步驟 Read More »

Scroll to Top