每次要分析資料,你是不是也有這種時刻——
數據都整理好了,軟體也開了,手指懸在鍵盤上,然後……腦子空白。😶
「這題該用 T-test 還是 ANOVA?」
「前後測可以用 T-test 嗎?」
「什麼時候才需要用 Regression?」
這篇文章不講公式,不推導原理,只告訴你什麼情況用什麼方法。
t 檢定(T-test):比較兩組的平均值
T-test 的核心問題只有一個:這兩組的平均值有沒有差異?
使用條件很單純:有兩組,而且只有兩組。組別必須是類別變數,像是性別(男/女)、實驗組與控制組、有無接受訓練。
⚠️ 如果超過兩組,就不能用 T-test,要換 ANOVA。原因很簡單:每做一次 T-test,犯錯機率就疊加一次。三組硬拆成三次 T-test,整體錯誤率早就超標。
還有一個很常犯的錯誤:把前後測資料當兩組獨立樣本跑 T-test。
前後測是同一批人測兩次,兩筆分數之間有關聯,這種情況要用的是 paired-sample t-test(配對樣本 T 檢定),不是 two-sample T-test。用錯了,結果就算顯著,也不代表你真正想證明的那件事。
延伸閱讀:如何分析前後測:進步分數 / 殘餘改變分數
One-way ANOVA:三組以上的平均值比較
只要你的組別超過兩組,就換 ANOVA。
One-way ANOVA(單因子變異數分析)的邏輯跟 T-test 一樣,都是在問「各組的平均值有沒有差異」,只是 ANOVA 可以同時比較三組以上,只做一次檢定,不疊加錯誤率。
例如:想看不同教學法(A、B、C 三組)對學生成績的影響,就用 One-way ANOVA。
⚠️ ANOVA 只是「全局檢定」,不是終點。
ANOVA 檢驗的假設是:
- H₀:所有組的平均值都相同
- H₁:至少有兩組的平均值不一樣
問題在這:ANOVA 只告訴你「有差異」,但不告訴你是哪兩組不一樣。
所以如果 ANOVA 的結果顯著(reject H₀),接下來還需要做 pairwise comparison(事後比較),逐一比較各組之間的差異,再搭配 p-value 校正(如 Benjamini-Hochberg 或 Bonferroni),避免因為多次比較而膨脹 Type I error。
簡單說:ANOVA 顯著 → 知道有差異 → pairwise comparison → 知道哪裡有差異。
Two-way ANOVA:同時看兩個類別變數的影響
如果你有兩個類別變數(例如:性別 × 教學法),想同時看它們對結果的影響,就用 Two-way ANOVA(雙因子變異數分析)。
Two-way ANOVA 還可以幫你看交互作用——也就是「不同性別在不同教學法下,效果是否有差異」這種問題。
Multiple Regression(線性回歸):多個變項如何影響結果
Regression 的核心問題是:這些變項,各自對結果有多大的獨立影響力?
和 T-test/ANOVA 最大的不同在於:Regression 讓你同時放入多個變項,在控制其他變項的條件下,估計每一個變項對結果的影響。這讓你可以回答更精細的問題,例如:「在控制了家庭背景之後,教學法對成績的影響還顯著嗎?」
另外,很多人以為 Regression 只能用在連續變項之間,其實類別變項轉成 dummy variable 一樣可以丟進去。延伸閱讀:什麼是虛擬變量?
ANOVA 跟 Regression,到底差在哪?🤔
這是很多人的疑問。直接說:ANOVA 其實是 Regression 的特例,兩者底層是同一套數學。
差別只在於:ANOVA 的自變項是類別變數;Regression 通常是連續變數(或 dummy variable)。如果你跑 ANOVA 和 Regression(用 dummy variable),結果會是一樣的。只要懂了這個,初、中級的統計就沒什麼問題了。
卡方檢定(Chi-square):比的是比例,不是平均值
前面所有方法比的都是平均值。卡方檢定比的是比例。
使用時機:你的變項是名目變數(nominal variable),想知道某件事在各組發生的比例是否相同。
例子:男女在「是否吃素」這件事上,比例有沒有差異?→ 卡方檢定。✅
⚠️ 注意:卡方檢定的變項不能是連續變數或 ordinal variable,必須是「是與否」、「男與女」這種名目變數。
一張表,快速對照 📊
一張圖看懂 📊
懶人決策流程 👇
不確定要用哪個?照這個流程走:
📌 你想比較的是「平均值」嗎?
→ 兩組 → T-test
→ 三組以上 → ANOVA
→ 前後測 / 配對樣本 → Paired T-test
📌 你想知道多個變項如何影響結果?
→ Regression(類別變項先轉 dummy variable)
📌 你比的是「比例」,而且變項是名目變數?
→ 卡方檢定
💡 如果你想看這個主題的精簡版,我最近在 Threads 整理了一個系列,從痛點出發、逐步拆解:用哪種統計方法好?(Threads 系列)
如果有任何問題,歡迎留言討論。😊
更新記錄:
2009/4/17 補充外部參考資源
2011/11/18 修正前後測說明(感謝川爸指正)
2017/9/18 加入副標題與 Multiple Regression 說明
2026/3/18 全文改寫:重新整理說明邏輯、加入決策流程、補充 Regression 多變項本質
