統計分析 - 研究生2.0

G*Power 計算統計檢定力 (一)

5 Comments / 統計分析 / By researcher20

如果不清楚什麼是統計檢定力，請見這裡：什麼是統計檢定力 (power)？

G*Power 是一套計算統計檢定力的軟體，非常容易上手。G*Power 提供 Windows 與 Mac 版本。

G*Power 下載：http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3/download-and-register

下載與安裝就不多說了，大家都可以自己作的。

這系列 G*Power 使用的部分，是基於進階閱讀的網頁所翻譯而成，並自己加上一些練習與說明讓大家學習。

情況一：已知母群體 (population) 的平均值與標準差。從母群體抽出一些 sample，想看抽樣與母群體之間是否有差異。

例子：某生產燈泡的公司宣稱它家的燈泡可持續 850 小時，標準差為 50。消費者保護團體認為這家公司的廣告不實，只有 810 小時而已。請問消費者保護團體需要測試多少燈泡，才可以有信心地證實兩者之間存在差異？

在此例子中，已知母群體，想要知道母群體與抽樣之間是否存在差異。在學術研究中，其實這種情況還滿少的，大部分的情況是未知母群體平均，但為了教學的完整性，還是從最基本的開始。

首先，執行 G*Power。由於此例子已知母群體，在步驟一選擇 means: difference from constant (one sample case)。

接下來選擇雙尾，power 選擇 0.9。

步驟 4 是計算 effect size，這其實心算就可以了，但還是教教怎麼用軟體算。選擇 determine 之後，右邊會彈出一個小視窗。依照範例的數字填上去，按 calculate 即可。其實在這例子中，effect size 就是 (850-810)/50，就會得到 0.8。按 calculate and transfer to main window。

回到主視窗之後，按下右下角的 calculate，就可以算出需要幾個燈泡來作這些實驗，可以得到 0.9 的 power。答案是 19。

練習題

1.…

G*Power 計算統計檢定力 (一) Read More »

什麼是統計檢定力 (power)？

2 Comments / 統計分析 / By researcher20

「老師，我的樣本只有 40 個人，power 夠嗎？」

這個問題，很多學生在論文口試前三天才問我。

那時候通常太晚了。

Power，或叫統計檢定力，是你在研究設計最開始就要想好的事，不是資料收完才補做的後台工作。這篇說清楚它是什麼、為什麼要做、影響它的因素、以及你的論文裡要怎麼處理。

什麼是 Power？

一句話版本：Power 是「真的有效果時，你偵測到它的機率」。

舉個例子：你的 A 介入方案對學習成效真的有幫助。你做了實驗，最後跑出 p < .05，發現了這個差異——這就是 power 在作用。

如果 power 是 0.8，代表重複做 100 次同樣的實驗，大約 80 次會得到顯著結果，20 次會漏掉。

漏掉的那 20 次，不是因為效果不存在，而是你的研究力道不夠。

這在統計學叫 Type II error（型二誤差，β）。而 Power = 1 − β。

為什麼要做 Power Analysis？三個好處

一、決定你需要多少樣本（事前，A priori）
根據預期效果量、α 值與目標 power，計算出需要多少受試者，再去收資料。不靠感覺猜，也不用收完才後悔。

二、申請 grant 幾乎必備
很多機構（尤其美國）在 proposal 審查時，沒有 power analysis 幾乎就直接刷掉。這不是統計細節，是拿到研究經費的門票。

三、事後解釋為什麼不顯著（Post hoc）
如果結果 p > .05，事後 power analysis 可以幫你釐清：是真的沒有效果，還是樣本太小、power 不足？

⚠️ 常見誤解：事後 power analysis 不能「拯救」一個不顯著的結果，也不能當作繼續收樣本的理由。它只是診斷工具。

四個影響 Power 的因素

因素	方向	說明
樣本數	↑ → Power ↑	最直接的調整手段
效果量	↑ → Power ↑	效果越大越容易偵測
顯著水準 α	放寬 → Power ↑	代價是型一誤差增加
單/雙尾	單尾 → Power ↑	需要有理論支撐才能用單尾

實務上最常調整的是樣本數。效果量來自文獻估計，α 通常固定在 .05，單雙尾取決於研究問題。

Power 要多大？

大部分社會科學領域的慣例是 ≥ .80。有些期刊或 grant 申請要求 ≥ .90。

使用 G*Power（免費，Windows/Mac 均有）可以快速計算樣本數或驗算 power。輸入：效果量、α、目標 power → 輸出：所需樣本數。

論文裡怎麼寫？

說明效果量估計來源（文獻 meta-analysis 或 pilot study）
報告設定的 α、power 目標值
報告計算出的所需樣本數，以及實際收到的樣本數
如果實際樣本 < 所需，說明原因和限制

範例句：

A priori power analysis using G*Power indicated that a sample of N = 85 was required to detect a medium effect (f = .25) with α = .05 and power = .80 in a one-way ANOVA with three groups.

…

什麼是統計檢定力 (power)？ Read More »

好書推薦：Multivariate data analysis

2 Comments / 好書推薦, 統計分析 / By researcher20

在研究生2.0 的回應中，有不少人常常問有關於多變量分析的問題。這部分有時候實在不是三言兩語就可以解決的，而且在討論多變量分析時，有時候觀念不清楚常常會導致專有名詞誤用和混用，造成一些困擾，這些問題我都常常碰到。我想，既然不少人有同樣的問題，索性推薦這本多變量分析的好書：Multivariate data analysis。

這本由 Hair, Black, Babin, and Anderson 所撰寫的 Multivariate data analysis，有許多的優點，我羅列如下。
1.…

開始寫你的分析備忘錄 (analytic memo)

3 Comments / 統計分析, 論文寫作, 質化研究 / By researcher20

最近太忙了，寫文的時間很零散，一方面是投稿文章的 revise and resubmit 很花時間，一方面是在作新的站，想要讓大家有新東西玩玩。這裡就先賣個關子，等作好之後大家再來踐踏吧~~

分析備忘錄 (analytic memo) 是我長久以來一直沒作的事情，不過最近洗心革面開始作，很有相見恨晚的感覺。為什麼我的老師沒逼我作這個呢？

分析備忘錄通常是質化研究者在分析資料的時候所作的記錄。由於分析問卷這種質化資料，要 assign code 常常有主觀性與不一致性，有了分析備忘錄之後有助於幫助你的分析並且避免主觀性與不一致性的問題。

如果你發現了一個 pattern，接下來要測試這個 pattern 是不是在其它 case 也適用，請務必寫在分析備忘錄裡，因為你在作訪談資料分析時可能會忘記。這個 working hypothesis 在經歷了測試之後，可能會變成一個理論，但那是後話，分析者要作的就是寫下來你所想的。如果你有了 working hypothesis 並寫下來之後，你可以順手作的一件事就是：寫下你為什麼會這麼想，並提供你現有的證據。這有助於形成理論並測試是否為真，當然更可以幫助你寫你的 paper。

除了寫你的 code 與你的假設，分析備忘錄很重要的一個功能是「備忘」，也就是你應該要寫下來你現在在作什麼，接下來要作什麼。

除了質化研究者以外，我也強烈建議量化研究者寫分析備忘錄。很多時候你同時作很多個 project，但過一段時間，你根本就不記得你作到哪裡了，誇張一點甚至找不到 code與 data file，這種事發生在我身上過，我也常看同學有同樣的困擾。如果你是多人合作一個計畫，那分析備忘錄更重要，因為有時候各說各話，大家的記憶都不同；更嚴重的是：有時候大家都會修改資料，可能造成資料不一致的問題，或是 code 不一致，會增加許多困擾的。

另外，寫下你下一步要作什麼是非常關鍵的一步，這有助於讓你在最短時間之內進入工作狀態，這部分我會撰寫專文，請大家期待~

…

開始寫你的分析備忘錄 (analytic memo) Read More »

準確地分析才是重點

Leave a Comment / 統計分析 / By researcher20

前文講：R-squared 不代表一切，似乎有點太令人驚訝，得到許多網友的反饋。很抱歉造成這些困擾，我應該把文章一次發完的。無奈最近有太多稿子在寫了，每篇文章都得分好幾次才能寫完。

R-squared 不代表一切，那究竟什麼重要呢？準確地分析才是重點。參考文獻這篇文章：Does Head Start make a difference?…

準確地分析才是重點 Read More »