Author name: researcher20

Stata: 加總同性質的資料(Aggregate similar Observations) ~2

以前寫過一篇:Stata: 加總同性質的資料(Aggregate similar Observations),裡面用的方法是collapse,這種情況用於:一個人有多筆資料 (用術語說,就是資料格式是長格式),你想要加總同性質資料,將每個人的資料變成一筆。

這種方法雖好,但如果你想要維持資料是長格式 (一個人有多筆資料),那collapse就不符合你的需求。

假設資料格式如下圖所示。sid代表student id,did代表文件 id,words代表每個文件的字數。

stata-aggregate-1

如果用 collpase 指令:

collapse (mean) words, by(sid)

結果會如下圖所示。原本一個學生有多筆sid,跑完collapse之後,每個學生只剩一筆資料了。

stata-aggregate-2

但這有可能不是你要的,你可能還想維持長格式,那該怎麼辦呢?重新載入資料,我們從頭來過。

如果想知道每個學生平均words,那可以利用egen指令:

bys sid: egen avgwords = mean(words)

結果如下圖所示:

stata-aggregate-3

兩種方法都可以,但結果稍有不同。要選用哪種,就看你要作哪種分析。…

Stata: 加總同性質的資料(Aggregate similar Observations) ~2 Read More »

學習批判性思考:從看Nature對葉詩文的文章談起

研究生2.0成立至今,寫過無數使用EndNote、Stata、SPSS、各種網站與工具的文章,並且包含了不少論文寫作、文獻整理的技巧。然而,在作學術研究中非常重要的一點:批判性思考,我一直想談,卻不知道該從何談起。

最近Nature 針對2012年奧運女子四百混合式游泳金牌得主葉詩文,發表了一篇文章:Performance profiling’ could help catch sports cheats這無疑是訓練批判思考的一個好例子。

文章http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109

學習批判性思考:從看Nature對葉詩文的文章談起 Read More »

博士論文要寫幾頁?

常常有人問我這個問題:「博士論文最少要寫幾頁?」這個問題不僅家人、朋友問,連讀研究所的朋友也問。

這問題其實沒什麼標準答案,因為論文的完成度不在於頁數,而是你是否完整地回答了你論文大綱裡的研究問題。

雖然是這樣說,還是很多人一定要一個頁數的。這真的是每個研究所、領域不同的。

先來看看幾個極端短的博士論文:

  1. John Nash 的論文 Non-Cooperative Games,32頁。數學領域的。簡介:Brief Introduction Here。全文:Download PDF File
  2. Edmund Landau的論文 New Proof of the Equation,據說只寫了17頁,但找不到德文原始文件。僅有Michael J.

博士論文要寫幾頁? Read More »

合併多csv或excel檔案為一個sheet

有時候要作統計分析前,有很多準備工作得作。如何把資料放到stata或其它統計軟體,就是一門學問。

最理想的狀況是:你只有一個excel或csv檔,你就可以輕易地匯入統計軟體。但常常人算不如天算,有時候你的資料是同樣格式,但你有幾十個甚至幾百個檔案。如果你直接匯入stata,那你每一個檔案得:1) 先匯入 2) 存成stata 格式 3) 清空資料,再匯入下一筆 4) 最後合併。

這太麻煩了。所以想辦法在excel或csv的時候,把多個檔案合併成一個,會省你很多時間。

上網半天,找了個還算省事的方法,步驟先說明如下:

1) 用軟體,將數個csv或excel檔,合併到一個spreadsheet裡。

2) 有必要時,重複上一步驟,最終還是得到一個檔。

3) 清理一下這個檔的表頭 (如果第一行是title而不是資料數值)。

4) 匯入 stata。

最關鍵的就是:如何合併?

上網半天,找到一個人家寫好的程式:http://jeeshenlee.wordpress.com/2010/09/23/jmc-excel-join-merge-combine-multiple-excel-sheets-or-excel-workbooks/

合併多csv或excel檔案為一個sheet Read More »

Scroll to Top