(承前文 探索性因素分析的設計與使用 (一) )
選擇因素個數
這點作者說的很好,要決定因素個數,就是在最精簡模型 (也就是最少的因素) 與有理 (也就是有足夠的因素能解釋這些因子) 之間作平衡。
傳統上來說,方法學家認為指明過少的因素個數比指明過多的因素個數還要來得嚴重,因為當因素過少時,本應該 load 在 B 因素的因子,因為模型並沒有納入 B 因素,變成錯誤地 load 在包含在模型的 A 因素。這當然會造成扭曲的結果,並影響到後來的轉軸與解讀。
相對地,選擇過多的因素會導致在轉軸時,主要因素正確呈現出來,但一些次要因素並沒有因子 load 在其上或是僅有單一因子。然而,選擇過多的因素仍是要避免的。
因為這些原因,許多方法學家就在探討如何找出最適合的因素數,其中一個非常有名的方法是 Kaiser criterion,這個準則就是看有幾個特徵值 (eigenvalues) 是否大於 1,並用這個數值來決定因素的數量。雖然這個方法看似簡單、客觀,但其實存在著一些問題 (詳細討論請見原文章),特別是經常會採取過多的因素數 (有時候是採取過少的因素數)。
第二種方法就是 scree test,也就是畫出相關矩陣的特徵值,並看在哪一個點之後有明顯的下降。在這個下降前有幾個特徵值決定了因素數。這種方式也受到不少批評,特別是它的主觀性。此外,有時候得到的圖並沒有明顯的下降。
第三種方法是平行分析 (parallel analysis),簡單地說,就是比較你從樣本裡得到的特徵值與從隨機資料產生的特徵值 (詳情請讀文章),模擬分析的結果認為平行分析所提供的結果還不錯,雖然統計軟體並未列入這種分析法。
註:parallel analysis 在 SAS 和 SPSS 中的使用,可參考:https://people.ok.ubc.ca/brioconn/nfactors/nfactors.html
因素轉軸 factor rotation
只要你的結果有兩個以上的因素,就有無數種方式可以同樣呈現你的資料結構。也就是說,只要有兩個或以上的因素,就沒有唯一的模型 (unique solution),所以研究者就要在眾多模型裡選擇一個。一般來說,許多人在選擇模型的時候都會採用 simple structure,因為易於解釋、心理學上有意義並可以複製。
雖然轉軸的方式有很多種,但基本就是兩大類:正交 (orthogonal) 與斜交 (oblique rotation)。轉軸的目的是讓因素更有意義,並同時看看因素之間的關係。更詳細一點來說,如果是正交轉軸的話,那就是假設因素之間沒有關連;相對地,斜交假設因素之間有一定的關連。
正交轉軸有許多方式,最普遍使用的是 varimax;斜交轉軸常見的誤區是:許多人都認為因素之間必定要存在相關性,但事實並非如此。如果實際的結果是兩個因子並沒有相關性,斜交轉軸所提供的結果會與正交轉軸非常相近,因素之間的相關性會很小並接近於 0。
然而,斜交轉軸的各種方法,並沒有哪一個是特別常用的主流。有不少是常用的方法,而且產生的結果也令人滿意,這些方法包括 direct quartimin rotation、promax rotation 與 Harris-Kaiser orthoblique rotation。
小結與建議
要作探索性因素分析之前,研究者要作許多決定。這五個方面的建議簡列如下:
1. 研究設計:因子要是因素的四倍以上,甚至到達六倍,特別是在不確定的情況下。如果因子之間共同性高,樣本僅100人即可;否則的話,樣本則要200人或更多。
2. 探索性因素分析的適切性:想想研究的目標/目的是什麼。
3. 如何fit model:三種方法(ML、principal factors、iterative principal factors) 各有所長,主要先看看資料是否有常態性。
4. 決定因素個數:用多重方式決定因素個數。principal factors 可以用 scree plot 和 parallel analysis,ML 則可加上 RMSEA 與 ECVI 來決定因素個數。
5. 轉軸:斜交轉軸是主流。
此篇文章後面還有不少篇幅是關於這些決定所造成的影響,有興趣的請自行閱讀。
參考文獻
Fabrigar, L. R., Wegener, D. T., MacCallum, R. C., & Strahan, E. J. (1999). Evaluating the use of exploratory factor analysis in psychological research. Psychological Methods, 4(3), 272-299. doi: 10.1037/1082-989x.4.3.272