在許多心理學的研究都特別強調 R-squared (或 R2)的重要,這無可厚非也可以理解,因為從定義上來說,R2 告訴你在你的模型裡,有多少的 variance 是可以被你的自變數解釋的。
然而,事情並不是那麼簡單,journal reviewers 並不會看到你有很高的 R2 就欣然地收下你的文章,不要求你作任何修改。我有一個老師更是直接說:R2 is (almost) nothing。
有什麼例子可以證明這個觀點呢?綠角財經筆記有一篇文章 Stupid Data Miner Tricks讀後感—-不斷尋求相關性的危害,提到了個有趣的例子:孟加拉的奶油產量與美國股市指數呈現高度相關,R2高達0.75。
很驚訝,是不是?還有更驚訝的!美國與孟加拉的奶油總產量,美國的起司產量與美國和孟加拉的羊隻總數,這三個數字與標普500做迴歸,發現 R2 高達0.99。這樣,你還相信 R2 嗎?
我不是要大家不相信這個數據,而是別被很高的R2 嚇著了。還需要具體一點的例子嗎?假設你有前、後測,實驗組與控制組,如果你跑第一個模型:用迴歸分析,前測與treatment dummy為自變量;與第二個模型:用迴歸分析,依變量是後測減前測,自變量是treatment dummy,你會發現第一個模型的 R2 比第二個模型高許多。你可以說第一個模型比第二個模型好嗎?
那到底什麼才重要呢?準確地預測 (precise estimation) 才是最重要的。至於如何準確地預測,這就是另外一個問題了。
相關閱讀:
如何讓你的p value significant?? 用隔壁老王的麵來預測台股超準 by u402053
说准确地预测才重要也不见得正确。要看是什么类型的研究了。
我亦同意 R-square 不是一切, 就如 SEM 的 model fit 不是一切, CFI 1.00 及 chi-square test 不顯著的模型亦可以是不合理不邏輯的模型.
粗略看了一看 Stupid Data Miner Tricks, 似乎重點為 data mining. Data mining 在心理學研究似乎不太受歡迎,或因 data-driven 的味道太重. 而「孟加拉的奶油產量與美國股市指數呈現高度相關,R2高達0.75」中所得的 R-square, 似亦非一般 linear regression 之 R-square.
未能詳讀 Stupid Data Miner Tricks, 若有錯, 請指正. 🙂
R2的確不是一切,因為廻歸模型好不好,還必須做殘差分析,而且必須看放入的自變數恰不恰當。
R2雖然不是一切,但如果殘差分析說明迴歸模型適當,且選取的自變數確實與依變數有因果關係,則R2非常重要,因為你必須由R2判斷自變數對於依變數變異的重要性;R2是自變數加入模型之後,依變數變異降低的比例。
迴歸分析的解釋變數與反應變數必須具有因果關係。但本文所舉例子,自變數與應變數之間根本不具因果關係;也就是根本不能進行迴歸分析。以錯誤的例子說明R2不是一切,如何說服人?而說出 R2 is nothing的人,則顯現其對R2的確實意義與應用仍有待加強。
更正:"而「孟加拉的奶油產量與美國股市指數呈現高度相關,R2高達0.75」中所得的 R-square, 似亦非一般 linear regression 之 R-square." <– 再讀一讀, 按上文下理, 該段之 regression 似仍為 linear regression. 我似乎弄錯了.