統計分析 - 研究生2.0

Stata: 快速檢視 missing data

Leave a Comment / 統計分析 / By researcher20

在初期處理資料，經常要處理 missing data。如果你要作 multiple imputation 或比較進階的統計，你更會想要在作這些之前，看看每個變數有多少 missing。

UCLA 製作了兩個 stata 的 addon，可以很輕易地看出 missing data。可以用findit nmissing 或是要下方指令安裝：

net install dm67_3.pkg…

(承前文探索性因素分析的設計與使用 (一) )
選擇因素個數
這點作者說的很好，要決定因素個數，就是在最精簡模型 (也就是最少的因素) 與有理 (也就是有足夠的因素能解釋這些因子) 之間作平衡。
傳統上來說，方法學家認為指明過少的因素個數比指明過多的因素個數還要來得嚴重，因為當因素過少時，本應該 load 在 B 因素的因子，因為模型並沒有納入 B 因素，變成錯誤地 load 在包含在模型的 A 因素。這當然會造成扭曲的結果，並影響到後來的轉軸與解讀。
相對地，選擇過多的因素會導致在轉軸時，主要因素正確呈現出來，但一些次要因素並沒有因子 load 在其上或是僅有單一因子。然而，選擇過多的因素仍是要避免的。
因為這些原因，許多方法學家就在探討如何找出最適合的因素數，其中一個非常有名的方法是 Kaiser criterion，這個準則就是看有幾個特徵值 (eigenvalues) 是否大於 1，並用這個數值來決定因素的數量。雖然這個方法看似簡單、客觀，但其實存在著一些問題 (詳細討論請見原文章)，特別是經常會採取過多的因素數 (有時候是採取過少的因素數)。
第二種方法就是 scree test，也就是畫出相關矩陣的特徵值，並看在哪一個點之後有明顯的下降。在這個下降前有幾個特徵值決定了因素數。這種方式也受到不少批評，特別是它的主觀性。此外，有時候得到的圖並沒有明顯的下降。
第三種方法是平行分析 (parallel analysis)，簡單地說，就是比較你從樣本裡得到的特徵值與從隨機資料產生的特徵值 (詳情請讀文章)，模擬分析的結果認為平行分析所提供的結果還不錯，雖然統計軟體並未列入這種分析法。

註：parallel analysis 在 SAS 和 SPSS 中的使用，可參考：https://people.ok.ubc.ca/brioconn/nfactors/nfactors.html…

探索性因素分析的設計與使用 (二) Read More »

探索性因素分析的設計與使用 (一)

Leave a Comment / 統計分析 / By researcher20

許多人的研究通常都會用問卷，而使用問卷時，常常為了要減少變數的數量，而會採用因素分析 (不懂的請參考：因素分析(Factor Analysis) )，特別是探索性因素分析 (請參考探索性與驗證性因素分析)。

探索性因素分析有其本身的限制，有的研究利用模擬數據質疑探索性因素分析並不能正確地表現出資料之間的結構，有的研究則著重於分析探索性因素分析適合與不適合使用的情形。Fabrigar, Wegener, MacCallm, and Strahan (1999) 這篇在心理學上非常有名的文章，就是在討論探索性因素分析的適用情形。我在閱讀之後收獲不少，因此就將這篇文章的重點節錄下來跟大家分享。

作者提到，在進行探素性因分析前，有五個需要考慮到的地方。1) 什麼變數要納入，sample的大小與特性；2) 要決定探索性因素分析是不是最適合的分析方式；3) 如果探索性因素分析是適合的，那接下來要決定有什麼方式來 fit the model.…

探索性因素分析的設計與使用 (一) Read More »

Stata: 更改 esttab 的顯著水準

7 Comments / 統計分析 / By researcher20

許多人都問過 Stata 在利用 esttab 輸出 regression 的時候，如何更改顯著水準。雖然我已經在留言中回過了，但還是有不少人詢問。我就一併回答這個問題：

esttab 一般的使用方式如下：

esttab * using test.rtf,…

Stata: 更改 esttab 的顯著水準 Read More »

Stata: 如何作層次迴歸分析(hierarchical regression)?

11 Comments / 統計分析 / By researcher20

Stata 並沒有內建層次分析 (hierarchial regression) 的指令(註)，所以要先進行安裝

net describe hireg, from(http://fmwww.bc.edu/RePEc/bocode/h) <br />net install hireg

之後如果要執行指令，就像下方一樣：

hireg dv (a)(b) (c) (d) ,nomiss

dv 是 dependent variable，後方一個()就是一個 model，所以有四個表示有四個models。跑完之後，Stata 會告訴你這些 models之間是不是有顯著差異，以及 R-square 的變化。

註：如果是要作 stepwise regression 的話，可以用Stata 內建的 stepwise 指令來使用。雖然裡面有 forward 和 backward hierarchial 的選項，但畢竟沒 hireg 這個指令好用。

…

Stata: 如何作層次迴歸分析(hierarchical regression)? Read More »