Author name: researcher20

解讀 logistic regression

什麼是線性迴歸?(What is Multiple Linear Regression?) 談論過迴歸分析主要可用來作預測與作因果分析,那既然迴歸分析這麼好,為什麼還要談 logistic regression (中文有人翻:羅吉斯迴歸) 呢?

最主要的原因:在一般的迴歸分析中,dependent variable (DV) 是連續變項 (continuous variable);如果 DV 不是連續變項,而是二分變項 (dichotomous variable,如:男或女、存活或死亡、通過考試與否) 等情況,這時你就必須使用 logistic regression 了

當然,如果你堅持的話,你也可以跑 OLS regression,一樣會得到結果的。如果你得到的 coefficient 是 0.066 的話,解讀就是:當 IV 增加 1 的時候,DV 發生的機率增加 6.6% 。然而,這樣作是有缺點的,通常沒辦法準確地估算 IV 對 DV 的影響 (通常是低估)。

為了解決這個問題,統計學家用 odds ratio (勝算比) 於 logistic regression 之中。要說勝算比之前,要先了解什解什麼是勝算勝算指的是:一件事情發生的機率與一件事情沒發生機率的比值。以拋硬幣為例,拿到正面與拿到反面的機率都是 0.5,所以odds ratio 就是 0.5 / 0.5 = 1。如果一件事情的發生的機率是 0.1 ,那勝算是 0.1 / 0.9 = 1/9 。如果一件事情發生的機率是 0.9 ,那勝算是 0.9 / 0.1 = 9。所以勝算是介於 0 與無限大之間

odds ratio 則是兩件事情的 odds 作比較。舉個例子來說,如果高學歷的人寫部落格的勝算(odds) 是  2.33,低學歷的人寫部落格的勝算是 0.67,那與低學歷的人比起來,高學歷的人寫作部落格的勝算是他們的 3.48 倍 (2.33/0.67),所以勝算比 (odds ratio)就是3.48

那如何解讀 logistic regression 的結果呢?通常你會看到文章裡呈現兩種結果:一種如果沒特別指名的話,就叫 coefficient,它的 DV 是某件事的 log odds ratio ,是勝算比取了自然對數;一種是 odds ratio 。這兩種值是可以互相轉換的,如果你的 log odds ratio 得到的 coefficient 是 0.405,你可以計算 odds ratio ,在 stata 指令列輸入 dis exp(0.405),會得到1.500。所以在讀文章的時候一定要讀清楚作者呈現的是 log odds ratio 或是 odds ratio

結果怎麼解讀呢?可從 log odds ratio 開始,解讀是:當 IV 增加一單位,log odds  會增加 ##。其實這解讀與 OLS regression 的解讀是一樣。如果你看到的是 odds ratio,解讀是:當 IV 增加一單位,odds 會增加 (##-1)*100%。兩種解讀方式都套上剛剛的數字,那結果會是:

log odds ratio: 當 IV 增加 1,log odds ratio of 某件事會增加 0.405 (請原諒我的英式中文@@)。

odds ratio: 當 IV 增加1,odds of 某件事會增加 (1.5-1)*100% = 50%。所以如果本來是 2,增加 50%的話,會變成 2 * 50% + 2 = 3 。換句話說,你也可以直接解讀為:當 IV 增加1,odds 某件事 (或是某件事的勝算。注意:這裡是勝算,不是勝算比) 會變成原本的值乘以1.5

如果你的勝算比 odds ratio 的 coefficient 是 0.667,那應該怎麼解讀呢?當 IV 增加1,某件事的勝算變成原本的值 (or 勝算) 乘以0.667。所以原本的勝算比如果是 3 的話,當 IV 增加1時,某件事的勝算會變成 2。你也可以說:當 IV 增加 1 時,某件事的勝算會減少 (1-.667)* 100% =33%

延伸閱讀

Logistic Regression介紹—晨晰統計林星帆顧問整理 http://tw.myblog.yahoo.com/da_sanlin/article?mid=1013&sc=1

解讀 logistic regression Read More »

多重比較 Multiple comparisons

在用 ANOVA 時,會得到一個 F-test,這個 test 只能告訴你整個 model 是否顯著 (i.e., 總體平均數不相同或不完全相同),並不能告訴你特定的組與組之間是否有差異。有很多種方法可以比較組間的平均值是否有差異,這些方式就稱作多重比較 (multiple comparisons) (註:這裡只說事後比較,不提事前比較)。

那為什麼有這麼多種方式,不要有一種就好?好問題,因為問題的核心是 Type I errors。不同的方法有不同的假設與處理 Type I errors 的方式。那為什麼問題的核心是 Type I errors呢?因為就整個 model 的 F-test 來說,你只有一個比較,換言之,你只要處理一次 Type I error 即可。但當你作多重比較時,你就要處理很多次 Type I error (三組間的比較就要處理三次,四組就要六次) ,在這情況下,就要調整 error rate 以免不小心犯了 Type I error 了。

如果要作 post hoc comparisons (有人叫 posteriori test) ,有許多選擇:1) Fisher’s Least Significant Difference (又稱為 LSD);2) Tukey’s Test;3) The Ryan Procedure (REGWQ);4) The Scheffé Test;5) Dunnett’s test for comparing all treatments with a control。

會產生這麼多方法,主要是比較的方式不同。有的方法是與均值作比較 (i.e.,…

多重比較 Multiple comparisons Read More »

研究生精選Firefox套件:翻頁自動化,讓閱讀更流暢

在三月時看了電腦玩物這篇 AutoPager 自動載入合併下一頁的翻頁套件,超簡單自訂新規則,那時候還沒意識到這樣的套件會對自己的閱讀產生什麼影響,所以遲遲沒嘗試,直到最近偷閒的時候才發現這個套件讓我的閱讀過程更加流暢,特別是用 multi-touch 觸控版之後

AutoPagerhttps://addons.mozilla.org/en-US/firefox/addon/4925/

研究生精選Firefox套件:翻頁自動化,讓閱讀更流暢 Read More »

出席研討會之打包清單

由於我是個忘東忘西的人,每次去研討會之前就會很恐慌,恐慌的不是要去報告,而是怕自己會忘記某一樣東西,讓旅途增加許多意外。在這些年的積累下來,整理了一個清單來跟大家分享。當然,每個人打包的東西或多或少有些不同,這僅供大家參考,你可以根據這份清單來修改,製作自己出席研討會的打包清單。

如果有不周詳的地方,也請大家補完喔!

打包的

  • 護照 (與駕照,特別是要開車的話)
  • 登機證 Boarding pass
  • 旅館/交通資訊
  • 研討會邀請函 (有時候進出海關時要看)
  • 電腦 (充電器)
  • 相機 (充電器)、傳輸線
  • 轉接頭 (特別是到不同洲的時候)
  • 衣服 (內衣褲)、襪子、睡衣褲
  • 正式衣服、皮帶、皮鞋、領帶 (如果要報告,但旅程又不想穿太正式的話)
  • 雨傘 (如果會下雨的話)
  • 電話 (充電器)
  • 刮鬍刀
  • 牙刷/牙膏 (美國很多地方不提供牙刷與牙膏的)
  • 隨身藥品 (中藥、西藥、感冒藥、胃藥) 與衛生用品
  • 護唇膏與其它保養用品、小瓶香水 (記得用透明袋子包起來)
  • 零鈔 (有些要給小費用的)
  • 名片
  • 指甲剪 (如果要旅行很久的話)
  • 梳子
  • 隨身碟 (如果要分享簡報給別人,或是用別人的電腦作簡報)
  • 拖鞋 (很多旅館不提供拖鞋的)
  • 即時沖泡湯 (如果吃不慣外國食物或早晚想喝熱湯的話)
  • 零食 (特別是 nuts 或 powerbar,避免旅途中餓了找不著東西吃)

事前要作的

  • 備份筆電檔案 (怕萬一電腦硬碟壞掉或被偷了)
  • 有敏感資料要記得刪除 (特別是用restricted data 或是有機密文件的)
  • 調鬧鈴起床 (別錯過飛機啊!)
  • 個人證照掃描與影印備份 (免得弄丟了)

2010.…

出席研討會之打包清單 Read More »

Scroll to Top