有時候要作統計分析前,有很多準備工作得作。如何把資料放到stata或其它統計軟體,就是一門學問。
最理想的狀況是:你只有一個excel或csv檔,你就可以輕易地匯入統計軟體。但常常人算不如天算,有時候你的資料是同樣格式,但你有幾十個甚至幾百個檔案。如果你直接匯入stata,那你每一個檔案得:1) 先匯入 2) 存成stata 格式 3) 清空資料,再匯入下一筆 4) 最後合併。
這太麻煩了。所以想辦法在excel或csv的時候,把多個檔案合併成一個,會省你很多時間。
上網半天,找了個還算省事的方法,步驟先說明如下:
1) 用軟體,將數個csv或excel檔,合併到一個spreadsheet裡。
2) 有必要時,重複上一步驟,最終還是得到一個檔。
3) 清理一下這個檔的表頭 (如果第一行是title而不是資料數值)。
4) 匯入 stata。
最關鍵的就是:如何合併?
上網半天,找到一個人家寫好的程式:http://jeeshenlee.wordpress.com/2010/09/23/jmc-excel-join-merge-combine-multiple-excel-sheets-or-excel-workbooks/
直接下載:JMC Excel (Trial version, Version 2) here
試用版一次只能匯入十個檔。如果你有幾十個,就分幾次合併成一個檔。
軟體操作還滿容易的,如果有大量匯入需求,也可以考慮購買。
如果你有更簡便的方法,或是你自行開發了excel 的macro,請麻煩告訴我喔!
csv 其实是纯文本文件,可以直接合并。用linux命令就极为简单:
cat 1.csv 2.csv n.csv > new.csv
即可,如果文件是按顺序编号的,那么也可以直接:
cat *.csv > new.csv
windows下可以按照gnuwin32或者cygwin,这些软体套装里面有cat命令的。
我是JMC Excel的程序员, 谢谢你的贴。