抽樣分配(sampling distribution)
在學統計的時候,我個人覺得抽樣是不好解釋的地方,特別是有人常問的問題:「如果母群體不是呈現常態分配,這樣抽樣出來,具有代表性嗎?」
觀念可以利用玩的玩出來。假設上圖是我們的母群體,你會發現這個母群體並非常態分配,而是呈現右傾斜的。如果我們一次從母群體中取出5個個體,然後計算這群個體的平均值,然後紀錄下來。做了很多次之後,這些平均值,會呈現常態分配。
不相信嗎?那到下面玩玩吧!
在學統計的時候,我個人覺得抽樣是不好解釋的地方,特別是有人常問的問題:「如果母群體不是呈現常態分配,這樣抽樣出來,具有代表性嗎?」
觀念可以利用玩的玩出來。假設上圖是我們的母群體,你會發現這個母群體並非常態分配,而是呈現右傾斜的。如果我們一次從母群體中取出5個個體,然後計算這群個體的平均值,然後紀錄下來。做了很多次之後,這些平均值,會呈現常態分配。
不相信嗎?那到下面玩玩吧!
許多人(包括我自己)在學統計時,總是被這一堆術語搞得頭昏腦脹。每一個分析都聽得清清楚楚,考試也都可以拿高分,但等到自己面對一大堆資料要動手分析時,卻不知道該用哪一種方法。
如果你不知道什麼時候要用卡方檢定、T-test (t檢定)、Anova或Regression,但每一項的計算和原理你都清楚,那請你接著往下看,希望本文可以幫助你掌握統計方法使用時機。
首先要談的是T-test。t檢定主要是檢驗兩組之間是否有均值的差異(當然也有one sample t-test,不過較少使用),所以條件是有兩組也只能有兩組。
組別是類別變數(categorical variable),像是性別、種族、國籍。如果是連續變數,也可以設一個標準,多少以上是好的,以下是差的,以此來產生類別變數。
如果超過兩組,必須用Anova來分析。
另外,常犯的錯就是把前、後測是否有顯著差異用two-sample t-test來檢定,不能「假裝」把前測當一組,後測當一組,拿來做two-sample T檢定,而是應該用paired-sample t-test來檢驗是否有差異。如果對分析前後測有興趣,可以參看下面文章如何分析前、後測: 進步分數(Analysis of Pre-test Post-test: Gain scores) 和如何分析前、後測: 殘餘改變分數 (Analysis of Pre-test Post-test: Residualized change score)。
…