ANOVA (中文有人翻「方差分析」或「變異數分析」)是許多人作論文時會用到的,特別是作實驗時,有兩組或兩組以上作比較。所以要用ANOVA的時機,就是你有categorical variable,想要看不同組之間是不是存在著差異。比如說男性和女性在數學成績上是否有差異,或是不同種族在數學上是否有不同差異,這兩個例子都可以用ANOVA。
如果你不知道要用ANOVA還是Regression,可參考用哪種統計分析好?
今天先講one-way Anova。為了讓大家也可以實作,我就拿我們老師教統計課用的範例dataset。此dataset是從NELS 88 (National Education Longitudinal Study of 1988)修改而來的,可以在可以在NELS88 Data for Intro Stats 下載。
解壓縮密碼:researcher20。
下載、解壓縮之後,請開啟資料庫。在開始作之前,先確定一下資料的筆數是不是5141筆,最後一個欄位是不是PassedMath3。如果都沒有問題,就開始作one way ANOVA。那我們的研究問題是什麼呢?
研究問題:不同種族是否在數學成績上有差異?
根據這個問題,我們的dependent variable 是 Math 3,independent variable是Race。
Analyze–> Compare Means–> One-way ANOVA
跑出來結果像這樣:
弄這些一點都不難,問題是:要看什麼?第一個要看的是Between Groups對過去的Sig.,也就是下圖圈起來的地方。怎麼看呢?就是拿這個值與.05、.01和.001比較。如果比.05大,那表示此變數對結果沒影著影響,拿我們的例子來說,就是種族對數學成績沒影響。下面的是.000,此值<.001,所以是有顯著影響的。
說半天,那要怎麼寫在文章裡呢?
要回報的就是F(4, 5135)=116.64, p<.001。
到這裡先想一想:這到底代表什麼?我們的問題是種族是否對數學成績有影響,現在結果出來,是有顯著影響的。那…是任何兩個種族之間都有顯著差異嗎?對不起,從上面的作法是看不出來的。ANOVA只會告訴你在你的類別變數中,是不是至少有兩組之間是有顯著差異的,但並不能看出是哪兩組,或是哪些組之間有差異。
如果想要知道是哪一組與其它組不同,就要用事後檢定(post hoc)。至於用哪一種,有時候要看領域,或是問問你的指導教授。通常不外乎Bonferroni、Tukey或Scheffe。如果要知道更多關於事後檢定用哪種多重比較,可參考新文:多重比較 Multiple comparisons。
怎麼做呢?剛我們在選變數的時候,右邊有一個Post Hoc。
點了之後你可以先試試用Boferroni。
出來之後結果會像下圖,同樣是先去看Sig的數值,這我就不多說了。
這裡範例所用的one-way ANOVA屬於無重複試驗的,也就是我只測一次而已,而不是同一個測量測三次(比如說為求精準,可能會血壓測量三次)。
最後要說的,在SPSS裡面,如果計算ANOVA的方式並不是只有一種。下次會介紹如何用GLM來作同樣的工作。
2012/8/14:更新範例檔連結與解壓縮密碼
附帶一提
我對於SPSS瘋狂的推出新版感到很神奇
目前已經出到SPSS17?!
天啊,他推出的頻率會不會太高了…
相對於SAS、STATA、Statictica來說的話…
不過SPSS的ANOVA分析在產生大量的資料分析結果時,是真的蠻方便的…大家可以照造本文的流程學一下囉
SPSS更新的速度只讓人覺得該公司想搶錢。最近我朋友還發現16.0版本做出來的資料沒有辦法在17.0版使用,只好先轉成EXCEL檔,再從17.0去讀那個EXCEL檔。現在如果不是學生特別指定需要,我根本懶得用SPSS來作分析。
哈哈,看來大家都覺得SPSS推出的速度太瘋狂了..我記得以前碰的時候才是12,現在就跳到17了,真不知道他們公司一年推出幾個版本啊!
LCChien說的那相容性實在太扯了,這問題還真大!我沒用過17(也還好沒用),所以不能實際測試。真難想像會有這樣的問題。
我是因為有個老闆用SPSS,所以才多少摸了一點。我自己還是喜歡可以寫語法的Stata or SAS,不過我SAS授權到期,於是就用Stata。反正我作的東西只要簡單的統計就好,語法不需要學很久。
很期待GLM的教學分享,運用GLM所要分析的東西~我不是很了解要看哪些值~>"<
期待板大的教學!! 謝謝
SPSS用GLM做anova的文章在這:http://newgenerationresearcher.blogspot.com/2009/03/spss-glmone-way-anova.html
吼吼, 研究生你這樣教『事後檢定』會不會毀人無數啊? 我印象中,Bonferroni、Tukey、Scheffe這些事後檢定法都有其先決條件,好比說各組的樣本數需不需相同?像Scheffe可以用在各組樣本數不同,但Tukey則必需用於各組樣本數相同的狀況下,不然可就誤用方法,跑出來的結果可信度就會遭到質疑囉!
感謝 大隱於市 不吝指正,已撰寫新文「多重比較 Multiple comparisons」http://newgenerationresearcher.blogspot.com/2010/05/multiple-comparisons.html,還煩請賜正。
不好意思,請問一下F(4, 5135)=116.64,這括號中的兩個數字意涵是甚麼?
一開始在種族的例子當中,應該是分為五種種族所以between groups的自由度是4吧?
那下面一行的within group自由度是5136這是甚麼意思?
版主對One way ANOVA解釋相當清楚,
不過依敝人淺薄經驗,
統計前確定資料同質性可能會比較準確,
畢竟這是做One Way ANOVA的基本假設,
PostHoc也的確有各自應對的條件。
詳情請見敝人拙文:
http://a7654311.pixnet.net/blog/post/26296612
如有錯誤煩請前輩們不吝指導。
我想請問做了"獨立樣本T檢定"及"單因子變異數ANOVA分析"後有出現T值和F值,
表示是統計量,用來檢測P值的?
T值和F值有沒有說測出來的數值不能高於多少/低於多少?
Scheffe法比較出來後,假設(1)>(2),可以用平均數來解釋嗎?
麻煩了><
請問站長!!
我對一群執行營隊活動(自變相)孩子用做前後側測驗,
我的測驗工具他只有一個結果分數作為依據(依變相),
我如果要證明營隊活動對我施測的向度是有效是否是使用單因子變數呢?
我有在SPSS中嘗試過您上述的步驟,
但在您圖片中第二個步驟時沒有任何選項可以點選,
想請問您我是否哪個步驟或概念弄錯了呢?
非常謝謝您!!
你載入資料了嗎?左邊看到變數了嗎?是哪個東西不能點選?
我載入資料了!!
雖然不清楚確切是哪個環節的設定影響,
但我調整過後有看見變數了!!
(是選擇類型的調整的關係嗎?
從字串調整成日期或數字)
謝謝站長的回應!!
請問 我看了一篇文章 他說他們研究是以 卡方檢定及 獨立樣本t檢定分析,然後在圖表就出現一欄「 t / χ 2」,請問這個的值,我要在spss的哪裡可以找到? 謝謝
想請問您~如果是two-way Anova跑出來的plot圖,交互作用完全都不顯著,這樣要怎麼寫分析呢?