Author name: researcher20

Excel: 計算單字出現次數

有時候我貪圖省事,就會拿 Excel 來作 interview 的 coding,其實codes不多的話,拿excel作coding 真的滿快、滿方便的。

通常我會把一句話或短的段落放在一個excel 的 cell,然後直接作 coding,像是abca。

問題就來了:如果我要知道全部有幾個 a、幾個b,該怎麼作呢?

非常簡單,在另外一個cell,用以下的公式:

=LEN(A2)-LEN(SUBSTITUTE(A2,"a",""))

A2 就是要計算的 cell。所以我會把所有的 cells 分別算次數,然後再加總。

這樣作如果熟練的話,其實滿快的。唯一的缺點就是如果你cell裡面句子長的話,你又直接作coding,會沒辦法知道你的codes對應哪一個部分。…

Excel: 計算單字出現次數 Read More »

Stata: 加總同性質的資料(Aggregate similar Observations) ~2

以前寫過一篇:Stata: 加總同性質的資料(Aggregate similar Observations),裡面用的方法是collapse,這種情況用於:一個人有多筆資料 (用術語說,就是資料格式是長格式),你想要加總同性質資料,將每個人的資料變成一筆。

這種方法雖好,但如果你想要維持資料是長格式 (一個人有多筆資料),那collapse就不符合你的需求。

假設資料格式如下圖所示。sid代表student id,did代表文件 id,words代表每個文件的字數。

stata-aggregate-1

如果用 collpase 指令:

collapse (mean) words, by(sid)

結果會如下圖所示。原本一個學生有多筆sid,跑完collapse之後,每個學生只剩一筆資料了。

stata-aggregate-2

但這有可能不是你要的,你可能還想維持長格式,那該怎麼辦呢?重新載入資料,我們從頭來過。

如果想知道每個學生平均words,那可以利用egen指令:

bys sid: egen avgwords = mean(words)

結果如下圖所示:

stata-aggregate-3

兩種方法都可以,但結果稍有不同。要選用哪種,就看你要作哪種分析。…

Stata: 加總同性質的資料(Aggregate similar Observations) ~2 Read More »

學習批判性思考:從看Nature對葉詩文的文章談起

研究生2.0成立至今,寫過無數使用EndNote、Stata、SPSS、各種網站與工具的文章,並且包含了不少論文寫作、文獻整理的技巧。然而,在作學術研究中非常重要的一點:批判性思考,我一直想談,卻不知道該從何談起。

最近Nature 針對2012年奧運女子四百混合式游泳金牌得主葉詩文,發表了一篇文章:Performance profiling’ could help catch sports cheats這無疑是訓練批判思考的一個好例子。

文章http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109

學習批判性思考:從看Nature對葉詩文的文章談起 Read More »

博士論文要寫幾頁?

常常有人問我這個問題:「博士論文最少要寫幾頁?」這個問題不僅家人、朋友問,連讀研究所的朋友也問。

這問題其實沒什麼標準答案,因為論文的完成度不在於頁數,而是你是否完整地回答了你論文大綱裡的研究問題。

雖然是這樣說,還是很多人一定要一個頁數的。這真的是每個研究所、領域不同的。

先來看看幾個極端短的博士論文:

  1. John Nash 的論文 Non-Cooperative Games,32頁。數學領域的。簡介:Brief Introduction Here。全文:Download PDF File
  2. Edmund Landau的論文 New Proof of the Equation,據說只寫了17頁,但找不到德文原始文件。僅有Michael J.

博士論文要寫幾頁? Read More »

Scroll to Top