統計分析

解讀OLS Regression中log transformed之後的變數

一般而言,OLS regression 的結果都可以寫成像下面的公式:

Y= a + b1*X1 + b2*X2

Y是dependent variable (簡稱DV),a是constant,X1與X2是 independent variables (簡稱IV),b1與b2是與其對應的coefficient。

解讀這樣的方程式一點都不難。X1變數增加1的話,Y會相對應的增加b1;X2變數增加1的話,Y會增加b2。

但是,如果你的變數經過了logarithmic transformation,也就是取了對數之後,事情就變得比較複雜了。首先要記得的是:log transformation之後的解讀,都是跟percent有關

狀況一:將DV取對數,IV維持不變

寫成公式還是一樣的:logY = a + b1*X1 + b2*X2

用logY表示DV已取了對數,b1與b2是新得到的coefficient。解讀是:X1增加1的話,Y隨之增加 100*b1 個%。

狀況二:將IV取對數,DV維持不變

公式:Y = a + b1*logX1 + b2*logX2

解讀是:X1增加1%的話,Y會增加 b1/100

狀況三:將DV與IV都取對數

公式: logY = a + b1*logX1 + b2*logX2

解讀是:X1 增加1%,Y增加b1 %

狀況三就是計量經濟提到的elasticity

參考網頁:https://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htm

解讀OLS Regression中log transformed之後的變數 Read More »

Stata: 如何分組畫regression line

在作regression的時候,分組比較是非常常見的,有時候為了看出兩組或多組之間的差異,最簡單的方式就是用圖表呈現,如下圖所示。要怎麼畫這個圖表呢?Stata有很多方式可以作,這裡提供兩種。
1.png
方法一:
regress inc educ male, beta
predict incfnoi if male==0
predict incmnoi if male==1

twoway (connected incmnoi educ if male==1, lcolor(black) ///
lpattern(dot) msymbol(diamond) msize(large)) ///
(connected incfno educ if male ==0, lcolor(black) ///
lpattern(solid) msymbol(circle) msize(large)), ///
ytitle(Income in thousands) xtitle(Education) ///
legend(order(1 "Men" 2 "Women")) scheme(s2manual)
上面這段程式是從A gentle introduction to Stata 抄來的,這本書的相關介紹可見這篇文章:Stata書籍介紹。出來的圖就向上面的圖一樣。

方法二:

net describe postgr3, from(<a href="http://www.ats.ucla.edu/stat/stata/ado/analysis">http://www.ats.ucla.edu/stat/stata/ado/analysis</a>)

Stata: 如何分組畫regression line Read More »

p值的迷思:顯著與非常顯著

在很多統計方法裡都會看到p值, 通常在許多期刊表格的下方都會看到*p<0.05, **p<0.01, ***p<0.001,所以就說*是顯著,**是很顯著,***是非常顯著 (這裡的顯著指的是magnitude),所以說p<.001 的效果比p<.05的好,這樣說對嗎?

要回答這個問題就要先回到p的定義。

p值 (也有人用p value) 用簡單的語言說,就是此測試結果有百分之幾的可能是由於機率的關係,再簡單一點就是出錯的機率,所以p<0.05 的意思就是此檢定小於5%的可能是由於機率。所以p value是檢驗是否有顯著差異,但不同的p值不代表顯著差異的大小。另外,p值越小,不代表就越能反駁統計假設,這僅能表示出錯的機率而已。

p值的迷思:顯著與非常顯著 Read More »

Stata: Nonparametric alternatives to conventional t tests

這一章的內容主要是從A gentle introduction to Stata作出來的筆記,加上一點點補充。這本書在 Stata書籍介紹介紹過,有興趣的可以自己翻翻。

a gentle introduction to stata
話說從頭。由於我背景不是統計系、數學系、經濟系,再加上自己莫名其妙的從作質化研究跳到作量化研究,學統計都是遇到什麼問題學什麼,結果也混得還可以。不過之前上一個Econn出身的大教授所教的課,講到event history analysis的時候,提到nonparametric,實在是被這名詞打敗了,只好再翻翻出補補基本功 (OS.…

Stata: Nonparametric alternatives to conventional t tests Read More »

迴歸分析的假設(Assumption of OLS regression)

雖然在部落格分享了不少STATA的coding,我不是專門學統計的,只是對coding有點心得,知道使用一些統計而已。不過對於統計後面的理論,總是一知半解。這或許是由於我上的統計課多半是著重推衍的過程以及之後的應用,以至於這方面沒特別強調。另一部分是讀了不少journal article,也沒看有人特別說出在跑Anova或regression前作了一些模式假設檢定的步驟,也導致我從來沒注意這些細節。

問題於是就這麼發生了。前一陣子寫了一篇文章,送給department其它的faculty作peer review,希望得到一些意見之後去投稿。得到的意見大部分是滿正面的,不過指出了不夠嚴謹的地方,沒作迴歸分析與ANOVA模式假設檢定的部分,而reviewer認為從我的descriptive statistics的表格看起來,應該是個要注意的問題。

天啊!在paper上面寫 seems like homegeneity assumption of ANOVA haven’t been met.…

迴歸分析的假設(Assumption of OLS regression) Read More »

Scroll to Top