什麼是統計檢定力 (power)?

「老師,我的樣本只有 40 個人,power 夠嗎?」

這個問題,很多學生在論文口試前三天才問我。

那時候通常太晚了。

Power,或叫統計檢定力,是你在研究設計最開始就要想好的事,不是資料收完才補做的後台工作。這篇說清楚它是什麼、為什麼要做、影響它的因素、以及你的論文裡要怎麼處理。

什麼是 Power?

一句話版本:Power 是「真的有效果時,你偵測到它的機率」。

舉個例子:你的 A 介入方案對學習成效真的有幫助。你做了實驗,最後跑出 p < .05,發現了這個差異——這就是 power 在作用。

如果 power 是 0.8,代表重複做 100 次同樣的實驗,大約 80 次會得到顯著結果,20 次會漏掉。

漏掉的那 20 次,不是因為效果不存在,而是你的研究力道不夠。

這在統計學叫 Type II error(型二誤差,β)。而 Power = 1 − β。

為什麼要做 Power Analysis?三個好處

一、決定你需要多少樣本(事前,A priori)
根據預期效果量、α 值與目標 power,計算出需要多少受試者,再去收資料。不靠感覺猜,也不用收完才後悔。

二、申請 grant 幾乎必備
很多機構(尤其美國)在 proposal 審查時,沒有 power analysis 幾乎就直接刷掉。這不是統計細節,是拿到研究經費的門票。

三、事後解釋為什麼不顯著(Post hoc)
如果結果 p > .05,事後 power analysis 可以幫你釐清:是真的沒有效果,還是樣本太小、power 不足?

⚠️ 常見誤解:事後 power analysis 不能「拯救」一個不顯著的結果,也不能當作繼續收樣本的理由。它只是診斷工具。

四個影響 Power 的因素

統計檢定力四個影響因素
因素方向說明
樣本數↑ → Power ↑最直接的調整手段
效果量↑ → Power ↑效果越大越容易偵測
顯著水準 α放寬 → Power ↑代價是型一誤差增加
單/雙尾單尾 → Power ↑需要有理論支撐才能用單尾

實務上最常調整的是樣本數。效果量來自文獻估計,α 通常固定在 .05,單雙尾取決於研究問題。

Power 要多大?

大部分社會科學領域的慣例是 ≥ .80。有些期刊或 grant 申請要求 ≥ .90。

使用 G*Power(免費,Windows/Mac 均有)可以快速計算樣本數或驗算 power。輸入:效果量、α、目標 power → 輸出:所需樣本數。

論文裡怎麼寫?

  • 說明效果量估計來源(文獻 meta-analysis 或 pilot study)
  • 報告設定的 α、power 目標值
  • 報告計算出的所需樣本數,以及實際收到的樣本數
  • 如果實際樣本 < 所需,說明原因和限制

範例句:

A priori power analysis using G*Power indicated that a sample of N = 85 was required to detect a medium effect (f = .25) with α = .05 and power = .80 in a one-way ANOVA with three groups.

G*Power 的實際操作步驟,請見本站的 G*Power 計算統計檢定力 (一)G*Power 計算統計檢定力 (二)

2 thoughts on “什麼是統計檢定力 (power)?”

Leave a Comment

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Scroll to Top