我指導過不少論文,有一個問題學生最常問:「老師,我用 Baron & Kenny 四步驟做中介分析,夠嗎?」
我的回答通常是:「在教育、心理、管理等領域,bootstrap 間接效果檢驗已經非常普遍,很多期刊和審稿人會期待看到。如果你還只用四步驟,很可能被要求補做。」
這篇從為什麼要改、怎麼跑、怎麼報告,一步一步說清楚。
先釐清一個學生最常有的誤解:中介分析不是在問「X 對 Y 還有沒有影響」,而是在問「X 是否透過 M 影響 Y」。 這個方向搞清楚,後面的邏輯才會通。
Baron & Kenny 四步驟,問題出在哪?
Baron & Kenny(1986)的四步驟中介檢驗,被引用超過 40,000 次,是教科書裡最常見的方法:
- X → Y 顯著(總效果 c path)
- X → M 顯著(a path)
- M → Y 顯著(b path,控制 X)
- 加入 M 後,X → Y 的效果減小或不顯著(中介成立)
這個方法的根本限制是:它用逐步顯著性來推論中介,而不是直接測試間接效果(indirect effect = a × b)的大小。
問題在於:a 顯著、b 顯著,不代表 a × b 顯著。反過來,a 或 b 個別不顯著,但 a × b 可能仍然顯著。這不是邏輯問題,是統計問題。
Sobel test 試圖直接測試 a × b,但它假設間接效果的抽樣分佈是常態的。而現實中,間接效果的分配往往是偏斜的(skewed),因此 Sobel test 在小樣本或中等樣本下容易過於保守、統計力不足,導致本來存在的間接效果被漏掉(Type II error)。
⚠️ 容易犯錯的地方:很多學生看到「X → Y 不顯著」就直接放棄做中介分析。但現代中介分析的觀點是:total effect 不顯著,仍然可能存在顯著的間接效果。X 可能透過 M 正向影響 Y,同時又有另一條路徑直接負向影響 Y,兩者抵消讓總效果看起來不顯著,但中介機制確實存在。
Bootstrap 的邏輯是什麼?
Bootstrap 不依賴間接效果分配是常態的假設,而是直接從你的資料出發,用重複抽樣建立信賴區間。邏輯如下:
- 從原始樣本中,重複有放回地隨機抽樣(通常 5000 次)
- 每一次都計算間接效果 a × b
- 把 5000 個 a × b 的值排序,取第 2.5 百分位和第 97.5 百分位,作為 95% 信賴區間(BootCI)
- 如果 95% BootCI 不包含 0 → 間接效果顯著
相較於 Sobel test,bootstrap 不依賴間接效果常態分配假設,更適合處理偏斜的間接效果分配,通常也有較佳的統計力。方法學文獻普遍建議以 bootstrap 信賴區間作為間接效果的主要檢驗方式,許多期刊也明確期待看到這種做法。
⚠️ 一個細節:PROCESS macro 提供兩種 bootstrap CI:percentile CI(直接取百分位)和 bias-corrected and accelerated CI(BCa,修正偏誤)。一般情況下 percentile CI 已經夠用,但如果間接效果分配明顯偏斜,BCa 更準確。PROCESS 預設是 percentile,若要改成 BCa 可在選項中設定。在論文裡報告時,說明你用的是哪種。
用 PROCESS macro 跑 Bootstrap 中介
Hayes 的 PROCESS macro 是目前最廣泛使用的工具,免費,支援 SPSS 和 SAS。
安裝:到 processmacro.org 下載,解壓縮後在 SPSS 執行 process.sps(Custom Dialog 版本可用介面操作)。
操作步驟(SPSS 介面版):
- Analyze → Regression → PROCESS
- 把依變數(Y)放入 Outcome Variable 欄位
- 把自變數(X)放入 Independent Variable 欄位
- 把中介變數(M)放入 Mediator(s) 欄位
- Model Number 選 4(單一中介,X → M → Y)
- Bootstrap Samples 設 5000,Confidence Level 設 95
- 按 OK
⚠️ 容易犯錯的地方(一):變項放錯欄位。 學生最常犯的是把 Mediator(M)和 Outcome(Y)放反。M 是中介,Y 是你最終要解釋的依變數。放反了整個路徑方向都錯,輸出完全沒有意義,而且 PROCESS 不會自動警告你。
⚠️ 容易犯錯的地方(二):控制變項亂加。 PROCESS 可以放共變項(covariates)。很多學生看到某個變項不顯著就直接加進去控制,但控制變項應該根據理論決定,不是反覆嘗試找到顯著。
如何讀輸出:
最重要的是最後的 INDIRECT EFFECTS 表格:
Effect:間接效果 a × b 的點估計值Boot LLCI:95% BootCI 下界Boot ULCI:95% BootCI 上界
判斷標準:BootCI 不包含 0 → 間接效果顯著。
⚠️ 容易犯錯的地方(三): 很多學生看到「Effect = .23」就說「間接效果顯著」,但根本沒看 CI。判斷顯著性是看 CI 是否跨 0,不是看點估計值的大小。Effect = .23 但 BootCI = [-.05, .51],這個間接效果是不顯著的。
怎麼在論文裡報告?
標準報告格式(APA 7 風格):
「Bootstrap 分析(5000 次重複抽樣,percentile CI)顯示,X 透過 M 對 Y 的間接效果為 b = .23,95% BootCI [.09, .41],CI 未包含 0,支持中介效果的存在。」
幾個細節要注意:
- 說明 bootstrap 次數和 CI 類型(percentile 還是 BCa)
- 非標準化係數 vs 標準化係數要全篇一致。 PROCESS 主要報非標準化結果(b),若要加報標準化係數(β),需另外說明來源,不能和非標準化混用。
- 同時報告 a path 和 b path:X → M、M → Y 的係數(非標準化或標準化),讓讀者知道中介路徑的方向和強度。
- 也報告直接效果(c’ path):控制 M 之後,X 對 Y 的直接效果,及其是否顯著。
⚠️ 容易犯錯的地方(一): 學生常常只報告間接效果,把 a path、b path、直接效果全部省略。這樣讀者無法判斷中介路徑的方向是否合理,審稿人一定會要求補。
⚠️ 容易犯錯的地方(二):把 PROCESS 輸出截圖直接貼進附錄,沒有整理成學術寫法。 統計結果必須整理成文字敘述(如上面的格式範例),截圖只能作為補充,不能取代正式報告。
完全中介 vs 部分中介——現在還這樣說嗎?
傳統上,加入 M 後若 X → Y 直接效果變不顯著,叫完全中介;若仍顯著但減小,叫部分中介。
現代方法學文獻已經逐漸淡化這個區分。原因很簡單:「直接效果顯不顯著」深受樣本數影響——大樣本什麼都顯著,小樣本什麼都不顯著。把「完全中介」建立在 c’ path 的 p 值上,是不穩健的。
現在更建議的做法是:
- 直接報告間接效果(a × b)的大小與 bootstrap 信賴區間
- 討論直接效果(c’ path)的方向和大小,並給出理論解釋
- 如果要補充效果量比較,可以考慮報告 proportion mediated(ab/c),但要注意:這個指標在 total effect 很小、接近 0、或方向不一致時,數值會不穩定、難以解釋,使用時需要保守說明。
⚠️ 容易犯錯的地方: 學生在結果段寫「本研究發現完全中介效果」,根據是 c’ 不顯著,但沒有討論樣本數對這個判斷的影響,也沒有說明還有哪些未測量的路徑可能解釋直接效果消失的原因。審稿人更在意的是機制是否站得住,不是你貼了哪個標籤。
多個中介變數怎麼做?
如果你的模型有多個中介變數,需要先區分兩種情況:
- 平行多重中介(Parallel Multiple Mediation):X 同時透過 M1 和 M2 各自影響 Y,兩個中介之間沒有因果關係。在 PROCESS 裡,單一中介用 Model 4;若要同時估計多個平行中介,需要在同一模型裡把 M1、M2 都納入,PROCESS 的操作方式是在 Mediator 欄位同時放入多個變項。
- 序列中介(Serial Mediation):X → M1 → M2 → Y,中介之間有理論上的因果順序。使用 PROCESS Model 6。
多個中介的情況下,PROCESS 會分別輸出每條間接路徑的 BootCI,以及「Total Indirect Effect」(所有路徑加總)。要分別報告每條路徑,不能只報總和——總和顯著不代表每條路徑都顯著。
⚠️ 容易犯錯的地方(一):多個中介只報 Total Indirect Effect。 讀者無法知道是哪條中介路徑在作用,理論主張無法被支持。
⚠️ 容易犯錯的地方(二):序列中介沒有交代理論順序。 審稿人幾乎必然會問:「你憑什麼假設 M1 先於 M2?」序列中介的使用前提是,兩個中介在時間或因果上有明確的先後順序,這個順序需要理論依據,不是統計決定的。
一個重要限制:橫斷資料能說什麼?
這是很多學生在論文討論段沒有交代清楚、審稿人也很容易抓的地方。
Bootstrap 中介分析在統計上可以告訴你:X 和 M 之間有關聯,M 和 Y 之間有關聯,這個「統計中介」(statistical mediation)是存在的。
但如果你的資料是同一時間點收集的橫斷問卷(cross-sectional),你不能宣稱已經「證明」因果機制。因果中介的推論需要:時間順序清楚、排除混淆變項、理論上的機制說明。橫斷資料只能提供統計上的一致性證據,不能排除反向因果或混淆的可能。
這不代表你的研究沒有意義——而是要在討論段誠實說明這個限制,並提出未來研究可以如何用縱貫或實驗設計來驗證因果機制。
⚠️ 審稿人最常抓的地方: 作者在結論段把「統計中介」寫成「X 透過 M 導致(caused)Y」,沒有任何限制說明。這在橫斷資料的論文裡是過度宣稱。
Baron & Kenny 能不能還是用?
Baron & Kenny 仍然可以用來解釋中介概念——它的四步驟邏輯清楚,適合在文獻回顧或理論段說明中介機制。但作為正式的統計檢驗,現在更建議直接報告 bootstrap 間接效果信賴區間。
換句話說:Baron & Kenny 幫你理解「為什麼要做中介」,bootstrap 幫你「把中介說清楚」。
如果有問題,歡迎留言。
更新記錄:2026-03 首次發布。