在 Stata 裡面,常用的 robust 的有兩種,一種是 robust regression,一種是 regression 裡加 robust 當作是 option。這兩種是完全不一樣的。
Robust regression (Stata 指令rreg) 主要是看 outlier (離群值) 的影響,因為你不想要 outlier 影響到你對 coefficients 的估計。
詳情可看 ucla 網站的介紹:http://www.ats.ucla.edu/stat/stata/dae/rreg.htm
另外一個會用到 robust 的是 regression 裡面的 robust 選項,語法像是:reg DV IV, vce(robust)。這處理的是另外一個問題:heteroscedasticity (中文有人翻成異方差) [nonconstant residual variance]. 不過這是個大題目,今天沒時間寫了,就簡單寫下這兩種常令人搞混的 robust。
您好,從這個blog和FB粉絲團學到許多實用的STATA技巧,相當感謝。最近在跑ivprobit遇到問題,查閱書籍都無法解決,才在此冒昧請教。
模型的例子像這樣:y1是probit的被解釋變數,y2、y3是兩個工具變數,其中y2=x1+x2,y3=x3+x4,最後回歸式為:y1=y2+y3+x5+x6。然而STATA似乎無法將y2、y3兩組不同的instruments分開跑,必須丟在一起,這在我文章的解釋上不通,實際跑時也發生問題(iteration數百次)。
想請問若我先regress y2、y3再創造新的變數代入probit,和ivprobit的結果的差別為何(事實上得到的參數的確有差別,但不知原因)?又要如何將我的理論化成指令去設定比較好呢?
冒昧留言,感謝您耐心閱讀。
你原本的指令是什麼呢?可以列出來看看嗎?
如果你先創造新的變數,那你是怎麼創造的呢?
原本是:
ivprobit y1 x5 x6 (y2 = x1 x2)
而書上說若有兩個instrumented variable,則一起放入:
ivprobit y1 x5 x6 (y2 y3 = x1 x2 x3 x4)
不過這時就會似乎變成x1 x2 x3 x4同時對y2和y3作迴歸。
我的論文和擁有房屋的機率有關,所以y1=擁屋機率,y2=恆常所得,y3=財富價值。所以y3裡不動產的特性,如房屋面積,和恆常所得就不會有關係,放在同一個括號的話應該不正確?
若創造新變數的話,則會以y2=x1+x2得到的參數後,X1+x2+常數項,創造出新的y2,y3以此類推。翻閱計量教科書,似乎這可能是最接近IV理論的做法…這是我想到的方法,也可能有誤,希望能和你請教。感謝!