統計分析 Archives - Page 3 of 24 - 研究生2.0

Archive

Category Archives for "統計分析"

Stata: mixed的aic與bic

在用Stata作多層線性分析的時候,預設是不會告訴你aic與bic的值的。

如果你要出現這兩個數值,可以在跑完mixed之後,輸入以下指令:

estat ic

那Stata就會告訴你aic與bic的結果

如果要用esttab輸入的話,拿上一次的例子來說,code 可以改成

esttab, b(2) aic(2) bic(2) transform(ln*: exp(2*@) 2*exp(2*@) ) ///
eqlabels(“” “var(tenure)” “var(_cons)” “var(Residual)”, none) ///
varlabels(,elist(:_cons “{break}{hline @width}”)) ///
varwidth(10)

就是在b(2) 後面加上aic() 與bic(), 結果就像下圖

Aic bic

繼續閱讀>>
2

Stata: 輸出mixed結果

Stata 拿來作多層線性分析挺方便的,在Stata 13以前的版本,用xtmixed;目前xtmixed已經不是Stata 13的官方的部分,但還是可以使用。Stata 13的用戶建議使用mixed。

使用mixed或xtmixed跑出結果之後,如果estat依照輸出regression table的辦法,那表格非常不好看,而且表格與你跑出來的數字會不一樣 (因為代表意義不一樣)。

拿具體例子來說吧!

從網路上先載入資料

webuse nlswork

之後先跑unconditional model

mixed ln_w  || id: tenure

結果如下圖

Hlm 1

接下來打指令輸出:

Hlm 2

 

你仔細比較數值,會發現第一張圖的var(tenure)的值是.0029,而到了第二張圖,輸出時,對應的確是-2.91。

var(_cons)也是,從.1123到了-1.09。

var(residual)從.085變成了-1.23。

這修改方法可以參考這裡的:http://repec.org/bocode/e/estout/advanced.html#advanced402

輸出的code如下:

esttab, b(2) nogaps nol replace transform(ln*: exp(2*@) exp(2*@) ) ///
eqlabels(“” “var(tenure)” “var(_cons)” “var(Residual)”, none) ///
varlabels(,elist(weight:_cons “{break}{hline @width}”)) ///
varwidth(10)

/// 是分行,注意最後一個字母與///之間要有空格

Hlm 3

 

 

這例子舉的其實挺不好的,因為level 1 的_cons跑掉了,因為這個變數是ln開頭的。如果這個改掉的話,就沒有這問題了。

如果有其它需要,還請參考http://repec.org/bocode/e/estout/advanced.html#advanced402的例子。…

繼續閱讀>>

Stata: 計算Kuder-Richardson (庫李信度)

一直以來作的研究都是用 Cronbach’s alpha,因為問卷多半是連續變量,但最近作的一項計畫,是處理學生答對與否,在信度方面,就不能用Cronbach’s alpha了,要用Kuder-Richardson reliability test,因為是categorical variable。

公式列在下面

NewImage

Where:

N = number of items on the test (25 for you)

= variance of total scores

= item p-value

在Stata,要先安裝一個套件才能使用。

要直接安裝的話,程式在下面:

net install kr20.pkg

或是用findit kr20

使用上也沒什麼困難的,語法如下:

kr20 varlist [if exp][in range], [sort(sortkey)]

在跑之前,要先確認資料格式是正確的,0是錯誤答案,1是正確答案,然後把變數放進語法中即可。…

繼續閱讀>>

探索性因素分析模型契合方式的比較

前面的文章探索性因素分析的設計與使用 (一) 講到了模型契合方式的選擇裡面提到了幾種常用的方法:

常用的方法有 maximum likelihood (簡稱ML), pricipal factors with prior estimation of communalities, 和 iterative principal factors。

ML 的優點是可以得到較廣的模型適合度指標 (a wide rage of indexes of the goodness of fit of the model)。此外,ML 還允許測試 factor loadings 與因素之間的相關度是否為顯著。然而,ML 的限制是假設了多變量的常態性 (normality)。如果嚴重違反常態性,得出的結果將是扭曲的。

principal factor methods (包含 iterated 與 noniterated的。注意:principal factor methods 與主成份分析是不一樣的) 的優點則是沒有常態性分佈的假設。此外,principal factor methods 也較不會得到扭曲的結果。然而,此種方法的缺點是提供較少範圍的 goodness of fit indexes (適合度指標)。此外,一般來說也不提供 confidence intervals 和顯著測試。

但這些解釋可能不是很直觀,所以找了個英文說明,讓大家更清楚。

 Factor analysis methods
繼續閱讀>>

探索性因素分析英文寫作

學統計的時候學的是觀念,但到了寫paper的時候,如何寫出來,還得在學學這些方面如何用英文來描述。另外,有時候分析都作了,但寫文章的時候又忘了,紀錄下這些步驟,也是提高文章的完整性。

下面針對探索性因素分析的部分,給出一些文章用的說法,大家自行修改,並附上一些寫作時可用的文獻。至於驗證性分析,目前還在整理,請大家靜待下一篇。

有些部分還不太全,這有空再補,或是請大家提供這方面有詳細描述的文章。文章也還有點亂,請大家包涵。如果有缺漏的地方,請大家指正。

探索性因素分析

可執行因素分析與否 (factorability)

這又叫作因子可分解性。

Evaluation of the correlation matrix indicated that it was factorable: Kaiser-Meyer-Olkin Measure of Sampling Adequacy = .##, which is “marvelous” (> .90) according to Kasier’s criteria (Pett, Lackey, & Sullivan, 2003).
繼續閱讀>>