R-squared 不代表一切

在許多心理學的研究都特別強調 R-squared (或 R²)的重要，這無可厚非也可以理解，因為從定義上來說，R²告訴你在你的模型裡，有多少的 variance 是可以被你的自變數解釋的。

然而，事情並不是那麼簡單，journal reviewers 並不會看到你有很高的 R²就欣然地收下你的文章，不要求你作任何修改。我有一個老師更是直接說：R² is (almost) nothing。

有什麼例子可以證明這個觀點呢？綠角財經筆記有一篇文章 Stupid Data Miner Tricks讀後感—-不斷尋求相關性的危害，提到了個有趣的例子：孟加拉的奶油產量與美國股市指數呈現高度相關，R²高達0.75。

很驚訝，是不是？還有更驚訝的！美國與孟加拉的奶油總產量，美國的起司產量與美國和孟加拉的羊隻總數，這三個數字與標普500做迴歸，發現 R²高達0.99。這樣，你還相信 R²嗎？

我不是要大家不相信這個數據，而是別被很高的R² 嚇著了。還需要具體一點的例子嗎？假設你有前、後測，實驗組與控制組，如果你跑第一個模型：用迴歸分析，前測與treatment dummy為自變量；與第二個模型：用迴歸分析，依變量是後測減前測，自變量是treatment dummy，你會發現第一個模型的 R² 比第二個模型高許多。你可以說第一個模型比第二個模型好嗎？

那到底什麼才重要呢？準確地預測 (precise estimation) 才是最重要的。至於如何準確地預測，這就是另外一個問題了。

4 thoughts on “R-squared 不代表一切”

Jfly
March 5, 2011 at 11:48 pm

说准确地预测才重要也不见得正确。要看是什么类型的研究了。

Log in to Reply
張樹輝 (Shu Fai Cheung)
March 6, 2011 at 7:17 am

我亦同意 R-square 不是一切, 就如 SEM 的 model fit 不是一切, CFI 1.00 及 chi-square test 不顯著的模型亦可以是不合理不邏輯的模型.

粗略看了一看 Stupid Data Miner Tricks, 似乎重點為 data mining. Data mining 在心理學研究似乎不太受歡迎,或因 data-driven 的味道太重. 而「孟加拉的奶油產量與美國股市指數呈現高度相關，R2高達0.75」中所得的 R-square, 似亦非一般 linear regression 之 R-square.

未能詳讀 Stupid Data Miner Tricks, 若有錯, 請指正. 🙂

Log in to Reply
HJ
March 6, 2011 at 1:40 pm

R2的確不是一切，因為廻歸模型好不好，還必須做殘差分析，而且必須看放入的自變數恰不恰當。

R2雖然不是一切，但如果殘差分析說明迴歸模型適當，且選取的自變數確實與依變數有因果關係，則R2非常重要，因為你必須由R2判斷自變數對於依變數變異的重要性；R2是自變數加入模型之後，依變數變異降低的比例。

迴歸分析的解釋變數與反應變數必須具有因果關係。但本文所舉例子，自變數與應變數之間根本不具因果關係；也就是根本不能進行迴歸分析。以錯誤的例子說明R2不是一切，如何說服人？而說出 R2 is nothing的人，則顯現其對R2的確實意義與應用仍有待加強。

Log in to Reply
張樹輝 (Shu Fai Cheung)
March 6, 2011 at 8:47 pm

更正:"而「孟加拉的奶油產量與美國股市指數呈現高度相關，R2高達0.75」中所得的 R-square, 似亦非一般 linear regression 之 R-square." <– 再讀一讀, 按上文下理, 該段之 regression 似仍為 linear regression. 我似乎弄錯了.

Log in to Reply

4 thoughts on “R-squared 不代表一切”

Leave a Comment Cancel Reply