統計分析

Stata: 加總同性質的資料(Aggregate similar Observations)

我們知道要如何建立dummy variable,基本上範圍都是在同一個observation,將特定某一或幾個欄位做處理。但是,如果你同一個人,有好幾個observation,你想要加總這些observation的某欄位,該怎麼辦?拿下面的例子來說,aid是文章流水號,sid是學生流水號。欄位1、2、3、4是我想要看的東西,是不同種類的修辭,裡面的值代表該修辭在該篇文章出現幾次。每一個學生寫的文章量不同,我想要計算學生文章總數,以及使用各修辭的總次數。

aid sid number TW 1 2 3 4
1 1 1 1 1
2 1 2 1 1
3 1 3 1 1
4 1 4 1
5 1 5 1 1
6 2 1 1 1
7 2 2 1 1 1
8 2 3 1 1
9 2 4 1 1
10 2 5 1 1
11 2 6 1 1 1

換句話說,我想要得到這樣的結果:

sid  number TW 1 2 3 4
1      5         1   0 4 0 0
2      6         1   0 4 0 4

number我要得到的是每個人寫幾篇文章,也就是count,欄位1、2、3、4要得到的是此學生使用修辭1、2、3、4的加總。這問題困擾了我很久,甚至直接拿出access來加總 (汗),後來總算在stata找到解決方案。

要使用的指令就是collapse。collapse的用處就是將資料整合起來,依stata說明的解釋是make dataset of summary dataset,也就是跟我們想要做的一樣。

我要依sid將資料整合起來,所以指令最後是加上, by (sid)。要collapse的欄位最重要的是欄位1至4,要加總,所以整行的語法像是:

collapse (sum) 1 2 3 4, by (sid) 如果有的地方要sum,有的地方要count,那語法就會變成:

collapse (sum) 1 2 3 4 (count) number, by (sid)

網友阿豆仔提問:如果資料是像這樣的,像要照id 和type加總,
id type income
1 1 200
1 1 100
1 2 50
2 1 100
2 1 200
2 3 150

並得到像這樣的結果:

id type income
1 1 300
1 2 50
2 1 300
2 3 150

該怎麼辦呢?
小小修改一下code就行:
collapse (sum) income, by (id type)
如果是要看frequency和percentage,那要用的是contract。我暫時用不到,所以留待以後再研究。

Stata: 加總同性質的資料(Aggregate similar Observations) Read More »

Stata: 輸出Logistic Regression到Word和Excel

這篇是承接上一篇的:Stata: 輸出regression table到word和excel

Logistic regression跑出來的東西跟multiple regression跑出來的東西有點像,但又有點不太一樣,在輸出時就得作一些調整。

在Stata裡,如果你要跑logistic regression,要先想要你用看coefficient還是odds ratio,因為指令有點不一樣。前者要用logit跑,後者要用logistic。後面的東西和regression指令的下法一樣,所以像這樣:

logit y x logistic y x

結果分別像下面二圖一樣:

1.png

2.png
如果是coefficient,那輸出基本上跟regression一樣,我自己用的code如下:

//舊code:esttab * using logistic1.csv,

Stata: 輸出Logistic Regression到Word和Excel Read More »

Stata 線上教學錄影檔(英文)

如果你想學Stata,又不想買書,那推薦看看下面的錄影檔跟網站吧!雖然是英文的,但她說的不太快,也滿清楚的,應該不用擔心聽不懂。而且有很多操作的地方,就算英文差一點應該也沒問題。

http://www.ats.ucla.edu/stat/stata/notes_old/default.htm

錄影檔有下面幾個部分,每段時間大約都在20-30分鐘左右。

Entering Data
Exploring Data
Modifying Data
Managing Data
Analyzing Data

看完功力應該就很強了!

Stata 線上教學錄影檔(英文) Read More »

如何分析前、後測: 進步分數(Analysis of Pre-test Post-test: Gain scores)

分析前、後測的方式其實有很多,先從簡單的例子講起。一般說來,實驗設計都有control group和treatment group,這兩組都接受了pre-test和post-test,那要怎麼分析這些資料呢?

要分析之前,想想我們的研究問題是什麼。在這樣的實驗設計,我們會問的問題可能是:此treatment是不是有顯著的效果?既然是要看效果,我們看的就是在兩次測驗中,這些受試者進步了多少。換言之,我們是看gain scores。

想清楚這點後面就簡單了。第一件要做的事情,就是create一個variable,這個variable是post-test減pre-test,我們就會得到受試進步多少了。接下來跑Anova,因為有2組,一個dependent variable,所以用one-way anova就可以了。如果你用SPSS但不熟悉怎麼跑或解讀結果,你可以參考這篇:SPSS: one-way ANOVA 教學

分析前後測還有不同的方式,以後再說。

如何分析前、後測: 進步分數(Analysis of Pre-test Post-test: Gain scores) Read More »

Scroll to Top