統計分析

ReadTable聞香版

最近發文不是很勤,一方面是在忙著作自己的研究,一方面期末又到了,要開始擠報告了 🙁 。另外還有一件正在忙的事就是:開發程式!開發什麼程式?就像文章標題所說的,是跟表格有關的程式。之前不是介紹過Stata: 輸出regression table到Word或Excel 嗎?秉持著懶還可以更懶的原則,我就突發奇想:既然表格都可以直接匯出,那分析也一併好了!於是乎:ReadTable(名稱暫訂)就這樣產生了。

先來看看畫面。輸入視窗如下:
1.png

當然不會要你輸入的。你可以從Stata或Excel將資料貼到此程式。

2.png

資料直接貼上。
3.png

 

 

 

然後按下分析:

4.png

目前只作了OLS regression,未來還會加logistic regression或其它的。至於中文的,嗯啊…,我自己翻譯怎麼都不順。有人要提供翻譯的話非常歡迎。英文到時候我還會再修過,現在權當測試用。

載點在哪?就說給你聞香而已,沒有要給你喝 XD 目前還有一些小問題,比如說coefficient還沒設定要四捨五入到哪一位,p的值會不小心最後多個0,表格目前還沒有column name……。另外,雖然是用java開發的,但因為我是用jdk 1.6,mac的相容性還不足,還沒搞定向下相容的問題。多語界面也還在想,還沒動手做。

第一次用java寫程式,所以速度比較慢。大夥就慢慢等哪時候我有空,完成第一個版本吧!

ReadTable聞香版 Read More »

Stata: 敘述統計(descriptive statistics)

學統計程式,有個dataset可以玩會比較能夠進入狀況,不然指令看過就忘了。此外,我覺得學習統計程式也是了解統計觀念的一個好方法,因為你可以直接看到結果。當結果與common sense不合,就會再去找找是不是哪做錯了。

找了很久,終於找到一個不大不小剛剛好,可以拿來練手的dataset,這dataset是general social survey 2000年所做的,你可以到此下載(記得選2000年),或是直接用我上傳到借來的空間。Gss2000的大小為3.61mb,原汁原味,沒經過任何修改。由於gss的網站好像沒看到可否自由散佈的相關資訊,就假設可以好了 XD 真的不行的話,那到時候再找別的dataset。

use http://twtcsl.org/dataset/gss2000.dta

Stata: 敘述統計(descriptive statistics) Read More »

Stata: 讀取SPSS檔案格式

每個統計軟體都有其特殊的格式,要在幾個統計軟體之間轉換,就變得很重要了。或許你會想:在統計軟體間轉換格式有什麼難的,反正SPSS、SAS、Stata都支援txt或csv格式,匯進去不就好了?

對,這聽起來有道理,可是如果你處理過大型資料,你就會發現這種方式少了很重要的東西:標籤(label)。所謂的標籤,包括所有變數的標籤,以及變數值的標籤。變數的標籤告訴我們這個欄位是作什麼的,變數值的標籤告訴我們每一值代表的意義。

這重不重要?這當然重要,試想如果你一個dataset包含超過50個變數,你今天作處理之後,你能保證過半年之後,你還記得這些是什麼嗎?這些標籤就是幫助你記得的。

廢話休說,進入正題。Stata有個功能,可以讓你直接讀進SPSS的sav格式,最重要的,就是保留這些標籤。首先要做的就是利用ssc指令,先安裝usespss這個module,然後用usespss using "路徑" 就可以成功讀進SPSS的檔案了。速度很快,絕對不輸商業軟體!記得匯入之後,看一下標籤是否都保留著喔!

ssc install usespss
usespss using "檔案路徑"

Stata: 讀取SPSS檔案格式 Read More »

Scroll to Top