Author name: researcher20

APA格式:線上期刊與DOI

APA格式是社會科學領域常用的引用格式,在2007年六月修訂了如何引用線上期刊,這部分牽涉到了DOI。DOI是digital object indicator的縮寫,為的就是用一個固定的網址,讓研究者能更迅速地找到所需要的文章。如果對DOI有興趣,可看Pbice的說明[Linguistics] DOI 轉址與電子期刊

APA更新了引用electronic references的指引,詳情可看APA style這部分的網頁:http://www.apastyle.org/elecref.html

APA格式:線上期刊與DOI Read More »

Stata: 讀取SPSS檔案格式

每個統計軟體都有其特殊的格式,要在幾個統計軟體之間轉換,就變得很重要了。或許你會想:在統計軟體間轉換格式有什麼難的,反正SPSS、SAS、Stata都支援txt或csv格式,匯進去不就好了?

對,這聽起來有道理,可是如果你處理過大型資料,你就會發現這種方式少了很重要的東西:標籤(label)。所謂的標籤,包括所有變數的標籤,以及變數值的標籤。變數的標籤告訴我們這個欄位是作什麼的,變數值的標籤告訴我們每一值代表的意義。

這重不重要?這當然重要,試想如果你一個dataset包含超過50個變數,你今天作處理之後,你能保證過半年之後,你還記得這些是什麼嗎?這些標籤就是幫助你記得的。

廢話休說,進入正題。Stata有個功能,可以讓你直接讀進SPSS的sav格式,最重要的,就是保留這些標籤。首先要做的就是利用ssc指令,先安裝usespss這個module,然後用usespss using "路徑" 就可以成功讀進SPSS的檔案了。速度很快,絕對不輸商業軟體!記得匯入之後,看一下標籤是否都保留著喔!

ssc install usespss
usespss using "檔案路徑"

Stata: 讀取SPSS檔案格式 Read More »

Stata: 加總同性質的資料(Aggregate similar Observations)

我們知道要如何建立dummy variable,基本上範圍都是在同一個observation,將特定某一或幾個欄位做處理。但是,如果你同一個人,有好幾個observation,你想要加總這些observation的某欄位,該怎麼辦?拿下面的例子來說,aid是文章流水號,sid是學生流水號。欄位1、2、3、4是我想要看的東西,是不同種類的修辭,裡面的值代表該修辭在該篇文章出現幾次。每一個學生寫的文章量不同,我想要計算學生文章總數,以及使用各修辭的總次數。

aid sid number TW 1 2 3 4
1 1 1 1 1
2 1 2 1 1
3 1 3 1 1
4 1 4 1
5 1 5 1 1
6 2 1 1 1
7 2 2 1 1 1
8 2 3 1 1
9 2 4 1 1
10 2 5 1 1
11 2 6 1 1 1

換句話說,我想要得到這樣的結果:

sid  number TW 1 2 3 4
1      5         1   0 4 0 0
2      6         1   0 4 0 4

number我要得到的是每個人寫幾篇文章,也就是count,欄位1、2、3、4要得到的是此學生使用修辭1、2、3、4的加總。這問題困擾了我很久,甚至直接拿出access來加總 (汗),後來總算在stata找到解決方案。

要使用的指令就是collapse。collapse的用處就是將資料整合起來,依stata說明的解釋是make dataset of summary dataset,也就是跟我們想要做的一樣。

我要依sid將資料整合起來,所以指令最後是加上, by (sid)。要collapse的欄位最重要的是欄位1至4,要加總,所以整行的語法像是:

collapse (sum) 1 2 3 4, by (sid) 如果有的地方要sum,有的地方要count,那語法就會變成:

collapse (sum) 1 2 3 4 (count) number, by (sid)

網友阿豆仔提問:如果資料是像這樣的,像要照id 和type加總,
id type income
1 1 200
1 1 100
1 2 50
2 1 100
2 1 200
2 3 150

並得到像這樣的結果:

id type income
1 1 300
1 2 50
2 1 300
2 3 150

該怎麼辦呢?
小小修改一下code就行:
collapse (sum) income, by (id type)
如果是要看frequency和percentage,那要用的是contract。我暫時用不到,所以留待以後再研究。…

Stata: 加總同性質的資料(Aggregate similar Observations) Read More »

Scroll to Top