什麼是統計檢定力 (power)？

「老師，我的樣本只有 40 個人，power 夠嗎？」

這個問題，很多學生在論文口試前三天才問我。

那時候通常太晚了。

Power，或叫統計檢定力，是你在研究設計最開始就要想好的事，不是資料收完才補做的後台工作。這篇說清楚它是什麼、為什麼要做、影響它的因素、以及你的論文裡要怎麼處理。

什麼是 Power？

一句話版本：Power 是「真的有效果時，你偵測到它的機率」。

舉個例子：你的 A 介入方案對學習成效真的有幫助。你做了實驗，最後跑出 p < .05，發現了這個差異——這就是 power 在作用。

如果 power 是 0.8，代表重複做 100 次同樣的實驗，大約 80 次會得到顯著結果，20 次會漏掉。

漏掉的那 20 次，不是因為效果不存在，而是你的研究力道不夠。

這在統計學叫 Type II error（型二誤差，β）。而 Power = 1 − β。

為什麼要做 Power Analysis？三個好處

一、決定你需要多少樣本（事前，A priori）
根據預期效果量、α 值與目標 power，計算出需要多少受試者，再去收資料。不靠感覺猜，也不用收完才後悔。

二、申請 grant 幾乎必備
很多機構（尤其美國）在 proposal 審查時，沒有 power analysis 幾乎就直接刷掉。這不是統計細節，是拿到研究經費的門票。

三、事後解釋為什麼不顯著（Post hoc）
如果結果 p > .05，事後 power analysis 可以幫你釐清：是真的沒有效果，還是樣本太小、power 不足？

⚠️ 常見誤解：事後 power analysis 不能「拯救」一個不顯著的結果，也不能當作繼續收樣本的理由。它只是診斷工具。

四個影響 Power 的因素

因素	方向	說明
樣本數	↑ → Power ↑	最直接的調整手段
效果量	↑ → Power ↑	效果越大越容易偵測
顯著水準 α	放寬 → Power ↑	代價是型一誤差增加
單/雙尾	單尾 → Power ↑	需要有理論支撐才能用單尾

實務上最常調整的是樣本數。效果量來自文獻估計，α 通常固定在 .05，單雙尾取決於研究問題。

Power 要多大？

大部分社會科學領域的慣例是 ≥ .80。有些期刊或 grant 申請要求 ≥ .90。

使用 G*Power（免費，Windows/Mac 均有）可以快速計算樣本數或驗算 power。輸入：效果量、α、目標 power → 輸出：所需樣本數。

論文裡怎麼寫？

說明效果量估計來源（文獻 meta-analysis 或 pilot study）
報告設定的 α、power 目標值
報告計算出的所需樣本數，以及實際收到的樣本數
如果實際樣本 < 所需，說明原因和限制

範例句：

A priori power analysis using G*Power indicated that a sample of N = 85 was required to detect a medium effect (f = .25) with α = .05 and power = .80 in a one-way ANOVA with three groups.

G*Power 的實際操作步驟，請見本站的 G*Power 計算統計檢定力 (一) 與 G*Power 計算統計檢定力 (二)。

什麼是統計檢定力 (power)？

什麼是 Power？

為什麼要做 Power Analysis？三個好處

四個影響 Power 的因素

Power 要多大？

論文裡怎麼寫？

2 thoughts on “什麼是統計檢定力 (power)？”

Leave a Comment Cancel Reply