G*Power 計算統計檢定力 (二)

情況二:paired sample t-test

paired sample t-test 是測試兩個有關聯的樣本是否有差異。前、後測研究就是 paired sample t-test 的一個應用情況;此外,當一組人是另一組人的 matched pairs,也適用於成對樣本t檢定,所以實驗組、控制組這種也是這種檢定方法的應用。

例子:一家減重公司宣稱,參加該公司為期八周的減重營後,每人平均減少 5 公斤 (mean of difference)。你認為這家公司廣告不實,你想要證實這一點。你計畫找幾個人加入減重營,在加入之前先測量他們的體重,並在八周之後再測量一次。先前的研究顯示八周之後,這群人體重後測與前測差距的標準差是 5 公斤 (standard deviation of difference)。你想知道要多少人加入這個減重營才能證實這個廣告是真或假。

首先,選擇成對樣本 t 檢定:means: difference between two dependent means (matched pairs)。

之後,將 power 改成 0.8。

1.png

接下來是計算 effect size。平均是 5,SD 是 5,effect size 是 1.…

G*Power 計算統計檢定力 (二) Read More »

G*Power 計算統計檢定力 (一)

如果不清楚什麼是統計檢定力,請見這裡:什麼是統計檢定力 (power)?

G*Power 是一套計算統計檢定力的軟體,非常容易上手。G*Power 提供 Windows 與 Mac 版本

G*Power 下載:http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3/download-and-register

下載與安裝就不多說了,大家都可以自己作的。

這系列 G*Power 使用的部分,是基於進階閱讀的網頁所翻譯而成,並自己加上一些練習與說明讓大家學習

情況一:已知母群體 (population) 的平均值與標準差。從母群體抽出一些 sample,想看抽樣與母群體之間是否有差異。

例子:某生產燈泡的公司宣稱它家的燈泡可持續 850 小時,標準差為 50。消費者保護團體認為這家公司的廣告不實,只有 810 小時而已。請問消費者保護團體需要測試多少燈泡,才可以有信心地證實兩者之間存在差異?

在此例子中,已知母群體,想要知道母群體與抽樣之間是否存在差異。在學術研究中,其實這種情況還滿少的,大部分的情況是未知母群體平均,但為了教學的完整性,還是從最基本的開始。

首先,執行 G*Power。由於此例子已知母群體,在步驟一選擇 means: difference from constant (one sample case)。

接下來選擇雙尾,power 選擇 0.9。

1.png

步驟 4 是計算 effect size,這其實心算就可以了,但還是教教怎麼用軟體算。選擇 determine 之後,右邊會彈出一個小視窗。依照範例的數字填上去,按 calculate 即可。其實在這例子中,effect size 就是 (850-810)/50,就會得到 0.8。按 calculate and transfer to main window。

2.png

回到主視窗之後,按下右下角的 calculate,就可以算出需要幾個燈泡來作這些實驗,可以得到 0.9 的 power。答案是 19。

3.png

練習題

1.…

G*Power 計算統計檢定力 (一) Read More »

什麼是統計檢定力 (power)?

「老師,我的樣本只有 40 個人,power 夠嗎?」

這個問題,很多學生在論文口試前三天才問我。

那時候通常太晚了。

Power,或叫統計檢定力,是你在研究設計最開始就要想好的事,不是資料收完才補做的後台工作。這篇說清楚它是什麼、為什麼要做、影響它的因素、以及你的論文裡要怎麼處理。

什麼是 Power?

一句話版本:Power 是「真的有效果時,你偵測到它的機率」。

舉個例子:你的 A 介入方案對學習成效真的有幫助。你做了實驗,最後跑出 p < .05,發現了這個差異——這就是 power 在作用。

如果 power 是 0.8,代表重複做 100 次同樣的實驗,大約 80 次會得到顯著結果,20 次會漏掉。

漏掉的那 20 次,不是因為效果不存在,而是你的研究力道不夠。

這在統計學叫 Type II error(型二誤差,β)。而 Power = 1 − β。

為什麼要做 Power Analysis?三個好處

一、決定你需要多少樣本(事前,A priori)
根據預期效果量、α 值與目標 power,計算出需要多少受試者,再去收資料。不靠感覺猜,也不用收完才後悔。

二、申請 grant 幾乎必備
很多機構(尤其美國)在 proposal 審查時,沒有 power analysis 幾乎就直接刷掉。這不是統計細節,是拿到研究經費的門票。

三、事後解釋為什麼不顯著(Post hoc)
如果結果 p > .05,事後 power analysis 可以幫你釐清:是真的沒有效果,還是樣本太小、power 不足?

⚠️ 常見誤解:事後 power analysis 不能「拯救」一個不顯著的結果,也不能當作繼續收樣本的理由。它只是診斷工具。

四個影響 Power 的因素

統計檢定力四個影響因素
因素方向說明
樣本數↑ → Power ↑最直接的調整手段
效果量↑ → Power ↑效果越大越容易偵測
顯著水準 α放寬 → Power ↑代價是型一誤差增加
單/雙尾單尾 → Power ↑需要有理論支撐才能用單尾

實務上最常調整的是樣本數。效果量來自文獻估計,α 通常固定在 .05,單雙尾取決於研究問題。

Power 要多大?

大部分社會科學領域的慣例是 ≥ .80。有些期刊或 grant 申請要求 ≥ .90。

使用 G*Power(免費,Windows/Mac 均有)可以快速計算樣本數或驗算 power。輸入:效果量、α、目標 power → 輸出:所需樣本數。

論文裡怎麼寫?

  • 說明效果量估計來源(文獻 meta-analysis 或 pilot study)
  • 報告設定的 α、power 目標值
  • 報告計算出的所需樣本數,以及實際收到的樣本數
  • 如果實際樣本 < 所需,說明原因和限制

範例句:

A priori power analysis using G*Power indicated that a sample of N = 85 was required to detect a medium effect (f = .25) with α = .05 and power = .80 in a one-way ANOVA with three groups.

什麼是統計檢定力 (power)? Read More »

Multivariate data analysis

好書推薦:Multivariate data analysis

在研究生2.0 的回應中,有不少人常常問有關於多變量分析的問題。這部分有時候實在不是三言兩語就可以解決的,而且在討論多變量分析時,有時候觀念不清楚常常會導致專有名詞誤用和混用,造成一些困擾,這些問題我都常常碰到。我想,既然不少人有同樣的問題,索性推薦這本多變量分析的好書:Multivariate data analysis
1.png
這本由 Hair, Black, Babin, and Anderson 所撰寫的 Multivariate data analysis,有許多的優點,我羅列如下。
1.

好書推薦:Multivariate data analysis Read More »

Scroll to Top