統計分析

什麼是統計檢定力 (power)?

Power 有人翻成統計檢定力、統計檢驗力、統計效能分析,為了我打字方便,我還是用 power。什麼是 power 呢?簡單地說,是指當有 effect 的時候,power 是偵測到這個 effect 的機率。可以換個方式說,power 是當事實上是要否定虛無假設,而拒絕虛無假設的機率 (it is the probability of rejecting the null hypothesis when it is in fact false)。再換個方式說,power 是避免錯誤接受虛無假設的機率

這部分詳細講就要牽涉到 Type I 與 Type II error 了。這部分想寫很久但還沒寫,先欠著。

那怎麼解讀 power 呢?可以舉個例子來說說嗎?當然可以,下面的例子來自進階閱讀,我簡單翻譯一下。

什麼是統計檢定力 (power)? Read More »

Multivariate data analysis

好書推薦:Multivariate data analysis

在研究生2.0 的回應中,有不少人常常問有關於多變量分析的問題。這部分有時候實在不是三言兩語就可以解決的,而且在討論多變量分析時,有時候觀念不清楚常常會導致專有名詞誤用和混用,造成一些困擾,這些問題我都常常碰到。我想,既然不少人有同樣的問題,索性推薦這本多變量分析的好書:Multivariate data analysis
1.png
這本由 Hair, Black, Babin, and Anderson 所撰寫的 Multivariate data analysis,有許多的優點,我羅列如下。
1.

好書推薦:Multivariate data analysis Read More »

開始寫你的分析備忘錄 (analytic memo)

最近太忙了,寫文的時間很零散,一方面是投稿文章的 revise and resubmit 很花時間,一方面是在作新的站,想要讓大家有新東西玩玩。這裡就先賣個關子,等作好之後大家再來踐踏吧~~

分析備忘錄 (analytic memo) 是我長久以來一直沒作的事情,不過最近洗心革面開始作,很有相見恨晚的感覺。為什麼我的老師沒逼我作這個呢?

分析備忘錄通常是質化研究者在分析資料的時候所作的記錄。由於分析問卷這種質化資料,要 assign code 常常有主觀性與不一致性,有了分析備忘錄之後有助於幫助你的分析並且避免主觀性與不一致性的問題。

如果你發現了一個 pattern,接下來要測試這個 pattern 是不是在其它 case 也適用,請務必寫在分析備忘錄裡,因為你在作訪談資料分析時可能會忘記。這個 working hypothesis 在經歷了測試之後,可能會變成一個理論,但那是後話,分析者要作的就是寫下來你所想的。如果你有了 working hypothesis 並寫下來之後,你可以順手作的一件事就是:寫下你為什麼會這麼想,並提供你現有的證據。這有助於形成理論並測試是否為真,當然更可以幫助你寫你的 paper。

除了寫你的 code 與你的假設,分析備忘錄很重要的一個功能是「備忘」,也就是你應該要寫下來你現在在作什麼,接下來要作什麼

除了質化研究者以外,我也強烈建議量化研究者寫分析備忘錄。很多時候你同時作很多個 project,但過一段時間,你根本就不記得你作到哪裡了,誇張一點甚至找不到 code與 data file這種事發生在我身上過,我也常看同學有同樣的困擾。如果你是多人合作一個計畫,那分析備忘錄更重要,因為有時候各說各話,大家的記憶都不同;更嚴重的是:有時候大家都會修改資料,可能造成資料不一致的問題,或是 code 不一致,會增加許多困擾的。

另外,寫下你下一步要作什麼是非常關鍵的一步,這有助於讓你在最短時間之內進入工作狀態,這部分我會撰寫專文,請大家期待~

開始寫你的分析備忘錄 (analytic memo) Read More »

準確地分析才是重點

前文講:R-squared 不代表一切,似乎有點太令人驚訝,得到許多網友的反饋。很抱歉造成這些困擾,我應該把文章一次發完的。無奈最近有太多稿子在寫了,每篇文章都得分好幾次才能寫完。

R-squared 不代表一切,那究竟什麼重要呢?準確地分析才是重點。參考文獻這篇文章:Does Head Start make a difference?

準確地分析才是重點 Read More »

Stata: robust 有兩種

在 Stata 裡面,常用的 robust 的有兩種,一種是 robust regression,一種是 regression 裡加 robust 當作是 option。這兩種是完全不一樣的。

Robust regression (Stata 指令rreg) 主要是看 outlier (離群值) 的影響,因為你不想要 outlier 影響到你對 coefficients 的估計。

詳情可看 ucla 網站的介紹:http://www.ats.ucla.edu/stat/stata/dae/rreg.htm

Stata: robust 有兩種 Read More »

Scroll to Top