在之前的文章提過什麼是多重比較,這是在作完regression或anova之後,針對一個categorical variable進行比較。
舉具體一點的例子來說。如果你有一個categorical variable叫condition,是你的實驗情況。0是對照組,1是實驗1,2是實驗2,3是實驗3。
如果你用anova分析,你會先分析出有組間差異,這是主效應 (main effect)。但是具體是哪兩組之間有差異,還必須進一步作分析才知道。如果你沒有特定的理論依據,來針對哪幾組作比較,那你必須作多重比較 (multiple comparisons) 來知道哪兩組存在差異。
在Stata裡面,作多重比較很容易,只要在跑完anova之後,可以直接用oneway的option來作事後比較。
先來看下面的例子。
sysuse nlsw88.dta, clear tabstat wage, by(industry) stat(n mean sd) oneway wage industry oneway wage industry, sidak bonferroni scheffe oneway wage industry, bonferroni
一開始是用sysuse來讀取stata內建的資料庫。在這個資料庫裡,我們想看不同的產業 (industry),是不是有不同的薪資 (wage)。
tabstat是讓你可以清楚的看到每一組的平均值,所以我想要先看不同產業的平均工具。結果如下圖。
之後跑oneway anova,可以看出產業之間,是存在薪資差異的,因為p < .05。
之後跑bonferroni測試,你可以看到finance的與manufact的薪資,存在顯著差異。另外,wholesale與transpor也存在顯著差異。
除此以外,regression跑完之後也可以作多重比較,我們下篇再說。