統計分析

Stata: 分組輸出regression table

網友洋問了個問題:

「我是用6個group跑回歸
by group regress fee asset cost
store m3
我發現我無法輸出群組的報表,而就m3而言他的資料為最後一群組的資料
我要怎麼樣才能分別呈現每個group資料??
謝謝」

之前網友 chien 也問過同樣的問題,不過我那時候沒想到好的辦法,現在終於在 esttab 相關的說明文件中找到了。

sysuse auto <br />by foreign: eststo: quietly regress price weight mpg

by 後面換成你要的變數。在用 by 的情況下,必須要先用 eststo 將結果存起來。如下圖所示,eststo 就會將這兩組分別存成 est1、est2。

1.png

最後在用 esttab 指令輸出:

esttab * using test.rtf,

Stata: 分組輸出regression table Read More »

G*Power 計算統計檢定力 (二)

情況二:paired sample t-test

paired sample t-test 是測試兩個有關聯的樣本是否有差異。前、後測研究就是 paired sample t-test 的一個應用情況;此外,當一組人是另一組人的 matched pairs,也適用於成對樣本t檢定,所以實驗組、控制組這種也是這種檢定方法的應用。

例子:一家減重公司宣稱,參加該公司為期八周的減重營後,每人平均減少 5 公斤 (mean of difference)。你認為這家公司廣告不實,你想要證實這一點。你計畫找幾個人加入減重營,在加入之前先測量他們的體重,並在八周之後再測量一次。先前的研究顯示八周之後,這群人體重後測與前測差距的標準差是 5 公斤 (standard deviation of difference)。你想知道要多少人加入這個減重營才能證實這個廣告是真或假。

首先,選擇成對樣本 t 檢定:means: difference between two dependent means (matched pairs)。

之後,將 power 改成 0.8。

1.png

接下來是計算 effect size。平均是 5,SD 是 5,effect size 是 1.…

G*Power 計算統計檢定力 (二) Read More »

G*Power 計算統計檢定力 (一):單一樣本與已知母群體的基礎操作

我在看研究計畫、proposal,或是學生剛開始設計研究時,最常問的一句話不是「你的理論是什麼」,而是:

你為什麼要收這麼多樣本?

很多人的答案其實都很隨便。有人說因為學長姐以前差不多收這個數字,有人說 30 個看起來像個基本盤,也有人說時間大概只夠做到這裡。

這些都不是研究設計上的答案。

真正比較像樣的答案應該是:你的樣本數,是根據研究問題、效果量假設、顯著水準與統計檢定力,一起推回來的。
而這也是為什麼,只要你開始碰研究計畫申請、投稿,甚至只是想把研究做得像樣一點,你遲早都得面對統計檢定力(statistical power)。

如果你對這個概念還不熟,建議你先看前一篇:什麼是統計檢定力 (power)?
那篇是在講概念;這一篇開始,我們進入實作。

G*Power 是一套非常經典、免費,而且到現在還是很好用的統計檢定力軟體。它有 Windows 跟 Mac 版本。對研究生來說,它最大的價值不是「會按」,而是它會逼你把研究設計裡幾個本來常常講不清楚的判準,真的講清楚。

這系列的 G*Power 教學,是基於 UCLA 的教材架構,再加上我自己的改寫、練習題與說明。我希望你不是只會跟著按,而是真的建立樣本數估算的直覺。

什麼情況下,適合用這個 one-sample case?

我們先從最基本的情境開始:已知母群體(population)的平均值與標準差,從中抽出一些樣本,想檢驗這組樣本與母群體之間是否有顯著差異。

老實說,在真實研究裡,這種「母群體平均數與標準差都已知」的情況並不常見。大部分時候,我們研究的就是未知母群體。但教學上,這是一個很好的起點,因為它最單純,也最容易幫你抓到統計檢定力在做什麼。

如果你連這種最基本的情況都沒有直覺,後面碰到 independent t-test、ANOVA、regression,只會算得更亂。

一個很適合練手的例子:燈泡壽命

來看一個具體例子。

某家燈泡公司宣稱,他們家的燈泡平均壽命是 850 小時,標準差為 50 小時。某消費者保護團體對這個說法有懷疑,認為實際平均壽命可能只有 810 小時左右。

那問題就來了:

如果消保團體真的要做一次正式測試,他們到底要買多少顆燈泡回來測,才比較有把握偵測到這個差異?

這就是統計檢定力問題很典型的樣子。你不是先決定「我想測 10 顆」或「我懶得測太多」;你是先界定你想抓到多大的差異,再回頭算需要多少樣本。

G*Power 實作步驟

現在把 G*Power 打開,我們一步一步來。

步驟 1:選擇檢定類型

因為這裡是拿一組樣本去和已知母群體常數比較,所以在主畫面中設定:

  • Test familyt tests
  • Statistical testMeans: Difference from constant (one sample case)
  • Type of power analysisA priori: Compute required sample size - given α, power, and effect size

這一步真正重要的地方是:
你先要知道自己在回答哪一種研究問題,軟體才有意義。
不要先打開 G*Power,才開始想哪個選項比較省樣本數。

步驟 2:設定統計參數

接下來設定幾個核心門檻:

  • Tail(s):選 Two(雙尾檢定)
  • Power (1-β err prob):設 0.9
  • α err prob:設 0.05

1.png

為什麼這樣設?

  • 雙尾檢定:因為在這個例子裡,我們要檢驗的是「有沒有差異」,而不是一開始就只押某一個方向。
  • Power = 0.9:代表如果真實平均壽命大約就是 810 小時,則在這些設定下,我們有約 90% 的機率偵測到它和 850 小時之間的差異。
  • α = 0.05:這是最常見的顯著水準,意思是你願意承擔第一型錯誤的上限。

這一步不是在填表格而已。
你其實是在決定:你希望研究有多大的把握抓到真實差異,以及你願意承擔多少錯判風險。

如果你之後要申請大型研究計畫(grants),這些數字就更不是隨便填。審查委員不是只看你有沒有寫 sample size,而是會看你這些設定背後有沒有邏輯。

步驟 3:計算效果量(effect size)

這一步是很多人第一次用時最容易卡住的地方,但這個例子其實很好算。

在 GPower 裡,你可以按 Determine*,讓系統幫你算 effect size。填入下列數字:

  • Mean H0(虛無假設,也就是公司宣稱值):850
  • Mean H1(你預期的實際值):810
  • SD(標準差):50

按下 Calculate 後,你會看到效果量 d = 0.8

這個數值其實不神祕,它就是:

|850 - 810| / 50 = 0.8

也就是說,你假設的差異大小是 0.8 個標準差

按下 Calculate and transfer to main window,把這個 effect size 帶回主畫面。

2.png

這一步在研究設計上的意思是:
你必須先對「你預期會看到多大的差異」有一個合理假設,樣本數才算得出來。

如果你對 effect size 沒感覺,可以回頭看這兩篇:

很多人不是不會按 G*Power,而是根本不知道 effect size 該怎麼想。這個問題不處理,後面樣本數算得再漂亮都沒意義。

步驟 4:得出所需樣本數

回到主畫面後,確認參數如下:

  • Tail: Two
  • Effect size d: 0.8
  • α: 0.05
  • Power: 0.9

然後按下右下角的 Calculate

在 Output parameters 區塊中,你會看到:

  • Total sample size = 19

這代表的是:

如果真實平均壽命約為 810 小時,而且母群體標準差約為 50,在上述假設與設定下,抽樣 19 顆燈泡,大約有 90% 的檢定力可以偵測到它和 850 小時之間的差異。

這裡要特別提醒一句:
統計上比較精確的說法是「偵測到差異的能力」,不是直接寫成「證明廣告不實」。統計顯著是推論上的結果,不等於法律、商業或事實上的最終裁定。這個界線最好分清楚。

3.png

練習題

學會了基本操作,現在輪到你自己動手調參數,感受一下這些設定如何影響樣本數。請用 G*Power 算以下幾題:

  1. 將 power 改成 0.8 ,需要幾個燈泡?
  2. power 0.9,單尾的情況下,需要幾個燈泡?
  3. power 0.9,雙尾, alpha 改成 0.1 ,需要幾個燈泡?
  4. 從上面三個例子,你觀察到什麼?為什麼會有這樣的結果?

這幾題不要只是把答案按出來而已。你真正要練的是:

當你放寬 alpha、降低 power、或把雙尾改成單尾時,為什麼樣本數需求會跟著變?

如果你把這個直覺建立起來,後面在寫論文、回審稿意見、做 proposal 時,你就不會只是在「按軟體」,而是真的知道自己在做什麼。

延伸閱讀

如果你想把這個主題往下接,我建議順著看這幾篇:

小結

這一篇你不用急著背公式,你只要先抓住一件事就夠了:

樣本數不是先決定的,而是由研究假設、效果量、alpha 與 power 一起推回來的。

G*Power 只是工具;真正重要的是,你對這些參數背後代表的研究判準,有沒有想清楚。

G*Power 計算統計檢定力 (一):單一樣本與已知母群體的基礎操作 Read More »

什麼是統計檢定力 (power)?

「老師,我的樣本只有 40 個人,power 夠嗎?」

這個問題,很多學生在論文口試前三天才問我。

那時候通常太晚了。

Power,或叫統計檢定力,是你在研究設計最開始就要想好的事,不是資料收完才補做的後台工作。這篇說清楚它是什麼、為什麼要做、影響它的因素、以及你的論文裡要怎麼處理。

什麼是 Power?

一句話版本:Power 是「真的有效果時,你偵測到它的機率」。

舉個例子:你的 A 介入方案對學習成效真的有幫助。你做了實驗,最後跑出 p < .05,發現了這個差異——這就是 power 在作用。

如果 power 是 0.8,代表重複做 100 次同樣的實驗,大約 80 次會得到顯著結果,20 次會漏掉。

漏掉的那 20 次,不是因為效果不存在,而是你的研究力道不夠。

這在統計學叫 Type II error(型二誤差,β)。而 Power = 1 − β。

為什麼要做 Power Analysis?三個好處

一、決定你需要多少樣本(事前,A priori)
根據預期效果量、α 值與目標 power,計算出需要多少受試者,再去收資料。不靠感覺猜,也不用收完才後悔。

二、申請 grant 幾乎必備
很多機構(尤其美國)在 proposal 審查時,沒有 power analysis 幾乎就直接刷掉。這不是統計細節,是拿到研究經費的門票。

三、事後解釋為什麼不顯著(Post hoc)
如果結果 p > .05,事後 power analysis 可以幫你釐清:是真的沒有效果,還是樣本太小、power 不足?

⚠️ 常見誤解:事後 power analysis 不能「拯救」一個不顯著的結果,也不能當作繼續收樣本的理由。它只是診斷工具。

四個影響 Power 的因素

統計檢定力四個影響因素
因素方向說明
樣本數↑ → Power ↑最直接的調整手段
效果量↑ → Power ↑效果越大越容易偵測
顯著水準 α放寬 → Power ↑代價是型一誤差增加
單/雙尾單尾 → Power ↑需要有理論支撐才能用單尾

實務上最常調整的是樣本數。效果量來自文獻估計,α 通常固定在 .05,單雙尾取決於研究問題。

Power 要多大?

大部分社會科學領域的慣例是 ≥ .80。有些期刊或 grant 申請要求 ≥ .90。

使用 G*Power(免費,Windows/Mac 均有)可以快速計算樣本數或驗算 power。輸入:效果量、α、目標 power → 輸出:所需樣本數。

論文裡怎麼寫?

  • 說明效果量估計來源(文獻 meta-analysis 或 pilot study)
  • 報告設定的 α、power 目標值
  • 報告計算出的所需樣本數,以及實際收到的樣本數
  • 如果實際樣本 < 所需,說明原因和限制

範例句:

A priori power analysis using G*Power indicated that a sample of N = 85 was required to detect a medium effect (f = .25) with α = .05 and power = .80 in a one-way ANOVA with three groups.

什麼是統計檢定力 (power)? Read More »

Multivariate data analysis

好書推薦:Multivariate data analysis

在研究生2.0 的回應中,有不少人常常問有關於多變量分析的問題。這部分有時候實在不是三言兩語就可以解決的,而且在討論多變量分析時,有時候觀念不清楚常常會導致專有名詞誤用和混用,造成一些困擾,這些問題我都常常碰到。我想,既然不少人有同樣的問題,索性推薦這本多變量分析的好書:Multivariate data analysis
1.png
這本由 Hair, Black, Babin, and Anderson 所撰寫的 Multivariate data analysis,有許多的優點,我羅列如下。
1.

好書推薦:Multivariate data analysis Read More »

Scroll to Top