「老師,我跑完前後測,用 paired t-test 對嗎?」
這是我最常聽到的一句話——不是因為學生懶,而是因為沒有人告訴他們,方法選擇其實有一個清楚的判斷邏輯。
選哪種方法?兩個關鍵問題
前後測的統計方法,取決於兩件事:
- 你的資料是否符合常態分佈假設?
- 你有幾個時間點要比較?
這兩個問題決定了一切。

四種情境與對應方法
✅ 常態 + 2個時間點(前測、後測)→ Paired t-test(配對樣本 t 檢定)
✅ 常態 + 3個以上時間點(前測、後測1、後測2……)→ Repeated-measures ANOVA(重複量數變異數分析)
✅ 非常態 + 2個時間點 → Wilcoxon signed-rank test
✅ 非常態 + 3個以上時間點 → Friedman test
怎麼確認常態假設?
很多人直接跑 Kolmogorov-Smirnov(K-S)檢定,但這是個常見錯誤:K-S 在樣本大的時候幾乎一定拒絕常態假設,讓你誤以為資料不符合常態分佈。
建議的做法:
- 樣本數 < 50:使用 Shapiro-Wilk 檢定
- 樣本數 ≥ 50:用 Q-Q Plot 加上 Skewness / Kurtosis 目視判斷
⚠️ 就算常態假設輕微違反,樣本數 > 30 時,t-test 仍然足夠穩健,不一定要換成非參數方法。
選定方法之後:怎麼呈現前後測的差異?
確定用哪種統計方法後,還有一個問題:你要用「差值」直接分析,還是用統計控制的方式?這涉及兩種常見的前後測分析策略:
- 進步分數(Gain scores):後測分數 − 前測分數,直接拿差值去分析
- 殘餘改變分數(Residualized change score):用迴歸控制前測後,取後測的殘差,更能排除前測水準的影響
這兩種做法各有適用情境,詳細說明請參考延伸閱讀。
延伸閱讀
如果有問題,歡迎留言。
更新記錄:2026-03 新建,整合常態假設判斷與方法選擇邏輯。