統計分析

開始寫你的分析備忘錄 (analytic memo)

最近太忙了,寫文的時間很零散,一方面是投稿文章的 revise and resubmit 很花時間,一方面是在作新的站,想要讓大家有新東西玩玩。這裡就先賣個關子,等作好之後大家再來踐踏吧~~

分析備忘錄 (analytic memo) 是我長久以來一直沒作的事情,不過最近洗心革面開始作,很有相見恨晚的感覺。為什麼我的老師沒逼我作這個呢?

分析備忘錄通常是質化研究者在分析資料的時候所作的記錄。由於分析問卷這種質化資料,要 assign code 常常有主觀性與不一致性,有了分析備忘錄之後有助於幫助你的分析並且避免主觀性與不一致性的問題。

如果你發現了一個 pattern,接下來要測試這個 pattern 是不是在其它 case 也適用,請務必寫在分析備忘錄裡,因為你在作訪談資料分析時可能會忘記。這個 working hypothesis 在經歷了測試之後,可能會變成一個理論,但那是後話,分析者要作的就是寫下來你所想的。如果你有了 working hypothesis 並寫下來之後,你可以順手作的一件事就是:寫下你為什麼會這麼想,並提供你現有的證據。這有助於形成理論並測試是否為真,當然更可以幫助你寫你的 paper。

除了寫你的 code 與你的假設,分析備忘錄很重要的一個功能是「備忘」,也就是你應該要寫下來你現在在作什麼,接下來要作什麼

除了質化研究者以外,我也強烈建議量化研究者寫分析備忘錄。很多時候你同時作很多個 project,但過一段時間,你根本就不記得你作到哪裡了,誇張一點甚至找不到 code與 data file這種事發生在我身上過,我也常看同學有同樣的困擾。如果你是多人合作一個計畫,那分析備忘錄更重要,因為有時候各說各話,大家的記憶都不同;更嚴重的是:有時候大家都會修改資料,可能造成資料不一致的問題,或是 code 不一致,會增加許多困擾的。

另外,寫下你下一步要作什麼是非常關鍵的一步,這有助於讓你在最短時間之內進入工作狀態,這部分我會撰寫專文,請大家期待~

開始寫你的分析備忘錄 (analytic memo) Read More »

準確地分析才是重點

前文講:R-squared 不代表一切,似乎有點太令人驚訝,得到許多網友的反饋。很抱歉造成這些困擾,我應該把文章一次發完的。無奈最近有太多稿子在寫了,每篇文章都得分好幾次才能寫完。

R-squared 不代表一切,那究竟什麼重要呢?準確地分析才是重點。參考文獻這篇文章:Does Head Start make a difference?

準確地分析才是重點 Read More »

Stata: robust 有兩種

在 Stata 裡面,常用的 robust 的有兩種,一種是 robust regression,一種是 regression 裡加 robust 當作是 option。這兩種是完全不一樣的。

Robust regression (Stata 指令rreg) 主要是看 outlier (離群值) 的影響,因為你不想要 outlier 影響到你對 coefficients 的估計。

詳情可看 ucla 網站的介紹:http://www.ats.ucla.edu/stat/stata/dae/rreg.htm

Stata: robust 有兩種 Read More »

Stata: 如何解決c(showbaselevels) undefined 錯誤

這是一個冷門的錯誤訊息,遇到的機會不太多,不過我偏偏就是遇到了。不管我跑簡單的指令像:mean A, over(B) 或是一般的 regress A B,都會出現這個錯誤的訊息,原來是 server 上的 Stata update 了,可是 update 不完全。

解決方式:

update all <br />update swap

理論上不用重開 Stata 與主機,不過如果都不行的話,就重開吧!

參考資料:

http://www.stata.com/statalist/archive/2010-06/msg00968.html

Stata: 如何解決c(showbaselevels) undefined 錯誤 Read More »

思考你的分析

最近副業作太兇了,所以來寫一篇文章重申一下我的本業。

這學期在 TA 博士班的統計課,這門課我聽了三遍了,每次聽都有新的收獲,我把我自己的想法寫下來,歡迎各位先進指教。

我每過一陣子就會遇到下面的情形:有人拿著他的資料來找我,花了很多解釋他的資料是長什麼樣子的,問我應該要怎麼分析

遇到這種情形,我通常會問:你的研究問題是什麼?有什麼理論根據?不過似乎很多人對這樣的回答挺不滿意的,因為這回答並沒有解決他們的問題。但這樣的情形我也愛莫能助,因為有太多的分析方式了。

拿下面的資料作例子,我們來討論討論。如果我們有一個 longitudinal 的資料,追踨了18年,從0歲到18歲。我們最有興趣看的是學習成就與家庭年收入之間的關係,其它相關變數已經列入考量,就不再討論。

0 1 2 3 18

學習成就

           

家庭收入

           

在這種情形下,你要怎麼分析?如果你不思考這兩種之間的關係,不考慮文獻,只是思考兩者之間是否有因果關係,那有很多種方式。上課的學生就列出了不少。

1.…

思考你的分析 Read More »

Scroll to Top