統計分析

Stata: 計算Intraclass correlation

之前有網友問到在Stata 用HLM時,不知道該怎麼算intraclass correlation。其實之前在這篇文章 Stata: 圖解 xtreg 結果 就已經說過了。

Intraclass correlation 有人翻成級內相關,有人翻成組內相關,在下面我就簡稱 ICC。

ICC 通常是與「組」或是「級」相關的,所以在HLM裡會經常用到。ICC是個數值,代表組間的同質性,所以常用來解釋該組或該級別解釋了多少variance。

在Stata裡,其實很簡單,在跑完分析之後,用estat icc就可以了。

請見下圖,先用webuse productivity 載入資料,再用mixed指令跑HLM。

Icc 1

之後輸入estat icc

Icc 2
這怎麼解讀呢?

region 的random effect 解釋了 15% 的variance,state 與 region 兩者的random effect 解釋了 85% 的variance.…

Stata: 計算Intraclass correlation Read More »

Stata: repeated ANOVA 作法

Stata 在repeated ANOVA方面,文件不多,最近因為一個計畫需要用到這種方析方式,花了不少時間學習。用完之後趕快寫下一點心得,以免以後健忘。

Stata 的repeated ANOVA必須將資料將寬格式轉換成長格式,如果不知道這些名詞,請參考這篇 Stata: reshape 將資料從寬格式改成長格式

下面的code有點複雜,請慢慢看。

anova dtest group / uid|group times times#group, repeated(times)

最前面的anova,是分析的指令,後面接的dtest,就是資料變成長格式之後,學生在不同時間的測試分數,所以就是要看不同時間測試分數的變化。

group的不同的組,這是一個categorical variable,不同的數值代表不同的實驗組別。
如果作一般的anova,就是這部分。

接下來會看到/,在stata 的說明文件裡是這麼說的:
The / symbol is allowed after a term and indicates that the following term is the error term for the preceding terms.…

Stata: repeated ANOVA 作法 Read More »

Stata: reshape 將資料從寬格式改成長格式

Stata 在作不同的分析時,會要求不同的資料格式,而資料格式指的是資料是長格式 (long format) 還是寬格式 (wide format)。一般而言,如果你不是panel data,通常寬格式就可以了。如果你是panel data,也就是你的outcome variable測量了許多次,那大部分的情況下你都必須將資料轉換為長格式。

不過這部分每個統計軟體不一樣,像SPSS的repated ANOVA,用寬格式即可,但在Stata裡面,repeated ANOVA必須將資料轉換為長格式才可以。

那究竟什麼是長格式,什麼是寬格式呢?

寬格式比較直觀,我們從寬格式說起。如果你的outcome測量了三次,那你的資料可能如下:

uid outcome1 outcome2 outcome3

1         100             90          95

換言之,寬格式一個人只有一筆資料,用不同的欄位來代表不同時間的測量

長格式的話,就不一樣,一個人有多筆資料,欄位相同,但多了時間變數

長格式如下:

uid time outcome

1      1       100

1      2         90

1      3         95

那在Stata裡面,該怎麼作呢?這透過reshape這個指令。在Stata 的說明裡面,說的挺清楚的:

Stata reshape

如果從寬格式轉換成長格式,指令如下:

reshape long outcome, i(uid) j(time)

要作轉換之前,你必須確保outcome前面部分是相同的,後面指的是時間,像之前例子說的outcome1, outcome2

在指令裡面,i後面括號放的是區別每一筆紀錄的變數,j後面放的是新變數,用來區別時間的。轉換之後,這個值就是outcome變數名稱的值。

Stata: reshape 將資料從寬格式改成長格式 Read More »

Stata 14上市了

今天收到Stata 14上市的郵件!簡單地看了一下,有很多新的功能,其中對我有幫助的是下面兩個。

支援Unicode

在眾多功能之中,支援unicode是比較吸引我的。資料用unicode這是已經確認了,但我沒看到相關說明在do file裡面,是否支援unicode。支援的話,以後寫code的註解就容易多了。

更高程度整合Excel

好像從 Stata 13開始,有了新的指令:putexcel,可以把結果直接輸出到excel裡面。putexcel 這項指令看起來對輸出敘述統計很有幫助,不過我已經習慣用esttab來輸出敘述統計correlationregression,所以可能要一段時間之後再嘗試。

如果你有興趣知道其它更新,歡迎到Stata的網站: http://www.stata.com/stata14/。…

Stata 14上市了 Read More »

Scroll to Top