8

畫句法樹狀圖的免費軟體(TreeForm Syntax Tree Drawing Software)

讀英語系或是linguistics的學生,想必都修過句法課吧!句法課必學的課題之一,就是畫樹狀圖。樹狀圖可以讓你清楚的知道句子的層次與結構,雖然並不能用簡單的規則就分析所有的句子,但在學習的過程中,這是不可或缺的訓練。樹狀圖畫出來的結果如下圖,這次要介紹的軟體,就是TreeForm Syntax Tree Drawing Software

tree.jpg
這套軟體其實還算滿新的,2004年才釋出第一個版本,此後不斷更新。我喜歡這套軟體的原因有許多,一是免費,二是免安裝,三是操作還算直覺。雖然不能完全達到我要的功能,但大體上來說已經是很不錯的軟體了。下載沒什麼困難,執行的話,只要電腦可以跑java的jre程式就可以了。執行之後的畫面如下。你可以發現,常用的結構都已放在左邊了,只要拉一拉,就可以完成你要作業了。

tree_1.jpg

第一步呢,當然是要按F9,拉一個分枝圖。拉完之後你會看到如下圖。什麼?為什麼第一個地方是空的呢?說真的,我也不知道,但是我知道該怎麼解決。因為如果是空的,你就無法改變裡面的內容了,所以下一步要做的,就是點左邊的F1,把這個東西拖放到空記號上面

tree_2.jpg

tree_3.jpg

拖放之後,你就會發現原本空記號的地方,變成了X了。這時候你就可以再擴充,或是改成你要的東西了。如果下面還有分枝的話,也很簡單,將F9的圖示拉到你要往下繼續分的地方,就會出現下一個分枝了。
tree_4.jpg

 

那這套軟體到底哪裡我不滿意呢?其實我要的很簡單,只是要所有的字,都出現在尾部。我不喜歡一些字在上面,一些字在下面,感覺那些字掉在空中,怪孤單的。如果能有這個功能,這個軟體就太完美了!祝大家種樹愉快囉!…

繼續閱讀
48

用哪種統計分析方式好?(卡方,Anova,T-test, or regression?)

what_methods
許多人(包括我自己)在學統計時,總是被這一堆術語搞得頭昏腦脹。每一個分析都聽得清清楚楚,考試也都可以拿高分,但等到自己面對一大堆資料要動手分析時,卻不知道該用哪一種方法。如果你不知道什麼時候要用卡分檢定、T-test、Anova或Regression,但每一項的計算和原理你都清楚,那請你接著往下看,希望本文對你有幫助。

首先要談的是T-test。T檢定主要是檢驗兩組之間是否有差異(當然也有one sample t-test,不過較少使用),所以條件是有兩組只能有兩組。組別是類別變數(categorical variable),像是性別、種族、國籍。如果是連續變數,也可以設一個標準,多少以上是好的,以下是差的,以此來產生類別變數。如果超過兩組,必須用Anova來分析。另外,常犯的錯就是把前、後測是否有顯著差異用two-sample t-test來檢定,不能「假裝」把前測當一組,後測當一組,拿來做two-sample T檢定,而是應該用paired-sample t-test來檢驗是否有差異。

One-way Anova(單因子變異數分析)是只有一個類別變數當作independent variable,檢驗此類別變數與其它連續變數(continuous variable)和結果的關係。比方說如果你想看性別、IQ對數學成績的影響,性別就是類別變數,IQ是連續變數,數學成績是結果變數(outcome variable)。

Two-way Anova(雙因子變異數分析)是有兩個以上的類別變數作為independent variables。比如說性別、種族與IQ對數學成績的影響,性別和種族就是類別變數。

問題來了,什麼時候用Anova,什麼時候用Regression呢?這兩者有何不同?其實Anova就是(Linear) Regression不同點就在Anova裡面有類別變數而已。如果你跑ANOVA跟regression(當然跑regression會要用dummy variable),你會得到一樣的結果。換言之,Linear regression裡的變數均為連續變數或dummy variable,如:年齡、IQ、成績、體重等,沒有類別變數。如果想知道更多關於regression,可參考這篇:什麼是線性迴歸?(What is Multiple Linear Regression?) 。只要懂了這個,我覺得初、中級的統計,初、中級統計就沒什麼問題了。

最後說說卡方檢定(Chi-square)。先想想卡方檢定測的是什麼?對,是比例。那你可能會有問題,T-test與Anova比的是什麼呢?當然不是比例,而是平均的差異。卡方測的是一件事情,在各組發生的比例是否相同。在繼續說之前,要先記得,卡方檢定的變數不是連續變數,也不是ordinal variable,而是名目變數(nominal variables,又稱為categorical variable),也就是「是與否」、「男與女」這種變數。所以常見的問題就是:男女和素食行為,或是男女與是否有大學學歷等。

如果你已經弄糊塗了,可以參看下表
what_methods_1.png

what_methods_2.jpg
what_methods_3.jpg

最後要說一點,我不是統計系的,寫這個也只是說出自己的理解而已。如果有不對的地方,還歡迎網友指正。

2009/4/17 補充:
如果上面的分析還不夠清楚,你想要看「用哪種統計分析方式好」終極版(英文),請到這個網頁參考:http://www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm
2011/11/18修正:原本寫的是

「另外,常犯的錯就是把前、後測是否有顯著差異用T-test來檢定。即使有兩組,前、後測也不是用T-test來檢定的,更別說有人「假裝」把前測當一組,後測當一組,拿來做T檢定。」

這並不準確,現已修正為:

「另外,常犯的錯就是把前、後測是否有顯著差異用two-sample t-test來檢定,不能「假裝」把前測當一組,後測當一組,拿來做two-sample T檢定,而是應該用paired-sample t-test來檢驗是否有差異。」

感謝川爸指正!…

繼續閱讀

免軟體!讓圖表動起來(跨平台)

讀研究所是種挑戰,因為老闆和自己總是產生匪夷所思的想法。比如說論文太空虛,就會想要多用點圖表,但用圖表又太單調的話,就想要讓圖表動起來。有這種想法的人很多,可是怎麼做呢?有些商業軟體如Swiff Chart Generator可以幫你輕易做到這些,不過這樣的軟體也所費不少。今天要介紹的,是免費的amCarts

amCharts是免費的,在使用上也需要多幾個步驟,不過我個人認為還算容易,只要搞懂幾行程式,很容易就做到了。首先要決定想要畫哪種圖表。這次的範例用常見的Column & Bar chart,還有許多的範例可在amCharts的官方網站找到。下面是這一次的完成圖。

  1. 首先,到amCharts的下載區,找Column & Bar charts,下載之後解壓縮。
  2. 從amCharts的examples裡,複製amcolumn1.html檔案,改檔名為test.html檔,把下面這段:
    so.addVariable(“settings_file”, escape(“amcolumn/amcolumn1/amcolumn_settings.xml”))

    改成
    so.addVariable(“settings_file”, escape(“setting.xml”));

  3. 在同一個檔裡,把<script type=”text/javascript” src=”../amcolumn/swfobject.js”></script>
    改成
    <script type=”text/javascript” src=”swfobject.js”></script>
  4. 同樣一個檔,把
    var so = new SWFObject(“../amcolumn/amcolumn.swf”, “amcolumn”, “520”, “380”, “8”, “#FFFFFF”);
    改成
    var so = new SWFObject(“amcolumn.swf”, “amcolumn”, “520”, “380”, “8”, “#FFFFFF”);
  5. 如果你的原始資料是excel而不是xml,把這段
    so.addVariable(“data_file”, escape(“amcolumn/amcolumn1/amcolumn_data.xml”));
    改成這段
    so.addVariable(“data_file”, escape(“data.txt”));
  6. 如果要準備簡報,得另外開一個資料夾presentation,把test.html放過去。另外,amCharts下有一個amColumn資料夾,把整個資料夾複製到presentation底下。
  7. 剛我們改了設定檔setting.xml和資料檔data.txt。setting檔在amcolumn_1.5.2.0amcolumn底下,叫amcolumn_settings.xml,把它複製之後,改名為setting.xml,並複製到presentation這個資料夾的根目錄。amcolumn.swf與swfobject.js也同樣複製過去。
  8. 打開setting.xml檔,找到這一段 <data_type>xml</data_type> ,改成 <data_type>csv</data_type> 。因為現在的資料格式是csv,不是xml。
  9. 現在是資料的部分。這邊有點tricky,雖然它說是csv檔,但讀的是txt,而且是有固定格式的。第一個是x軸,用;分開,第二個數字是y軸,如果有多個,一樣用;分開。範例如下:

    1949;2.54;20.21

    1950;5.51;19.73

    1951;2.53;18.43

    1952;2.53;18.08

    1953;2.68;19.01

    1954;2.78;19.57

    1955;2.77;19.58

    1956;2.79;19.43

    1957;3.09;40.83

    1958;9.01;19.73

    記得把你的資料弄好,存成data.txt,存在presentation資料夾的根目錄。

  10. 打開網頁,應該就可以看到會動的圖表了。據官方網站的說明,這個Flash chart是可以插入到PowerPoint的,不過我的Vista不幸功成身退(淚),等我修好了之後,再跟大家分享。
繼續閱讀
4

免安裝!線上PDF轉成Word檔(Zamzar)

在讀研究所的時候,常會遇到一個情形:指導教授拿一個PDF檔給你,希望你把它變成Word檔,並做編輯後,變成一篇簡報或新的文章。但是PDF這種格式,如果不用Adobe自己昂貴的軟體,還有什麼方法可以轉成Word檔呢?

以下我們做個實驗,用一段中文文件,試試目前網站自動轉換服務,看看效果如何。我所採用的文件包含了幾個格式:中文字、圖片、表格、自動標號。pdf test.jpg

  1. Koolwire (迅速,但不支援中文)
    Koolwire這個網站界面是英文和義大利文,如果你看到看不懂的文字,請在右上面點英國國旗,就可以看到英文界面。koolwire.jpg
    Koolwire採用的是Email轉換,如果你要把pdf轉成word,把信寄給doc@koolwire.com,標題與內容我是採用他們的範本,標題是:rtf/word conversion via e-mail,內容我想隨便打應該可以。koolwire_email.jpg

    這網站轉換的速度很快,10:48寄出的信,同一分鐘就收到了。不過收到的卻是轉換失敗的信,殘念~~

    koolwire_failure.jpg

  2. Zamzar  (速度慢,但支援中文)
    zamzar_web.jpg
    Zamzar是本次測試中唯一成功的網站,它完全支援中文以及本次測試檔案所使用的格式。它支援的單檔大小是100MB,上傳完之後,選擇你要的格式,填入你的Email,再來要做的就是。對,沒開玩笑,它雖然完整支援,但是不保證什麼時候會寄給你。我的檔案只有不到200K,等了大約兩、三個小時,收到他們寄來的一封信,上面附了一個連結,點了之後就可以去下載了。zamzar_success.jpg轉的結果令人滿意,格式並沒有什麼出入,看起來和原檔相差無幾。如果想使用這個網站,最重要最重要的就是不要急。我並沒有嘗試用大檔的經驗,也沒多次測試,如果有人有使用心得,還歡迎分享!

    pdf_result.jpg

  3. Adobe email conversion service (無效的email)
    根據一些網站的介紹,Adobe提供email附加檔從pdf轉成html(不是rtf)的功能,不過經我的測試,pdf2html@adobe.com這個信箱無法使用,我的信被退回來了,而且顯示的錯誤訊息是無此使用者!雖然網站上面是說此功能支援英文與大多數的歐洲語言,但你至少也給我個不支援此種語言的錯誤訊息,而不是找不到使用者。放棄!adobe_email.jpg
  4. Media-Convert (不支援繁中)
    這個網站是另外一個網站服務,測試的結果是不支援繁體中文,把網站語言換成簡體,一樣出現錯誤。我沒有使用簡體文件的需求,所以沒有進一步測試簡體文件是否轉換正常。

以上的比較,結果很清楚,如果不想安裝軟體完成pdf轉word這件工作,又不很急的話Zamzar 可說是個不錯的選擇!…

繼續閱讀

浮水印 輕鬆加

研究生繳交論文全文電子檔案時,有許多學校會要求學生在電子檔上加上該校的浮水印。這一篇就是要教大家怎麼把浮水印加到論文電子檔裡面去。

第一步當然就是把浮水印下載到電腦裡。再視實際需求,如果(1)學校要求在每一章的第一頁顯示浮水印,那麼,請在每章第一頁的任何地方,插入浮水印。如果(2)學校要求論文每一頁都要有浮水印,那麼,請利用頁首頁尾功能,將游標放在頁首部份,加上浮水印。

基本步驟如下:

(圖1)開啟論文檔案,(選擇該頁某處或頁首部份),點選插入圖片從檔案(選擇浮水印圖檔位置)

插入浮水印1.JPG

(圖2)選取目標浮水印,按插入

插入浮水印2.JPG

(圖3)插入後,檔案裡就會出現浮水印,圖片位置還需進一步設定。請點選圖片按右鍵,選擇設定圖片格式

設定圖片格式.JPG

(圖4)點選配置標籤下的文字在前,對齊方式選置中,選完按確定。

圖片配置.JPG

(圖5)完成啦!

完成圖.JPG

繼續閱讀