Archive

Category Archives for "統計分析"

Stata: Anova的pairwise comparison 多重比較

在之前的文章提過什麼是多重比較,這是在作完regression或anova之後,針對一個categorical variable進行比較。

舉具體一點的例子來說。如果你有一個categorical variable叫condition,是你的實驗情況。0是對照組,1是實驗1,2是實驗2,3是實驗3。

如果你用anova分析,你會先分析出有組間差異,這是主效應 (main effect)。但是具體是哪兩組之間有差異,還必須進一步作分析才知道。如果你沒有特定的理論依據,來針對哪幾組作比較,那你必須作多重比較 (multiple comparisons) 來知道哪兩組存在差異。

在Stata裡面,作多重比較很容易,只要在跑完anova之後,可以直接用oneway的option來作事後比較。…

繼續閱讀

Socioviz:分析Twitter的免費工具

許多人都對使用social media有興趣,因為這些資料就在網路上,只要找到方式下載並分析就可以,不需要與人互動或作長時間的觀察來搜集資料。

今天介紹一個好用的免費工具:Socioviz。這網站可以讓你輸入關鍵字,從中抽出相關的hashtag。

網址:http://socioviz.net/…

繼續閱讀
1

比較迴歸分析模組之間的差異

用迴歸分析的時候 (如果不懂迴歸分析,可參考這裡),一種常見的作法就是同樣的dependent variable,每個模式加一些新的變數下去,這種模式之前也寫過文章介紹,叫作層次迴歸分析 (參考 什麼是層次迴歸分析 (hierarchical regression)?),但可千萬別把這種模式與階層性線性模式搞混 (詳見 什麼是階層線性模式 (hierarchical linear modeling)?

繼續閱讀
2

Stata: 計算Intraclass correlation

之前有網友問到在Stata 用HLM時,不知道該怎麼算intraclass correlation。其實之前在這篇文章 Stata: 圖解 xtreg 結果 就已經說過了。

Intraclass correlation 有人翻成級內相關,有人翻成組內相關,在下面我就簡稱 ICC。

ICC 通常是與「組」或是「級」相關的,所以在HLM裡會經常用到。ICC是個數值,代表組間的同質性,所以常用來解釋該組或該級別解釋了多少variance。

在Stata裡,其實很簡單,在跑完分析之後,用estat icc就可以了。

請見下圖,先用webuse productivity 載入資料,再用mixed指令跑HLM。

Icc 1

之後輸入estat icc

Icc 2
這怎麼解讀呢?

region 的random effect 解釋了 15% 的variance,state 與 region 兩者的random effect 解釋了 85% 的variance.…

繼續閱讀

Stata: repeated ANOVA 作法

Stata 在repeated ANOVA方面,文件不多,最近因為一個計畫需要用到這種方析方式,花了不少時間學習。用完之後趕快寫下一點心得,以免以後健忘。

Stata 的repeated ANOVA必須將資料將寬格式轉換成長格式,如果不知道這些名詞,請參考這篇 Stata: reshape 將資料從寬格式改成長格式

下面的code有點複雜,請慢慢看。

anova dtest group / uid|group times times#group, repeated(times)

最前面的anova,是分析的指令,後面接的dtest,就是資料變成長格式之後,學生在不同時間的測試分數,所以就是要看不同時間測試分數的變化。

group的不同的組,這是一個categorical variable,不同的數值代表不同的實驗組別。
如果作一般的anova,就是這部分。

接下來會看到/,在stata 的說明文件裡是這麼說的:
The / symbol is allowed after a term and indicates that the following term is the error term for the preceding terms.…

繼續閱讀
1 2 3 24