在學統計的時候,我個人覺得抽樣是不好解釋的地方,特別是有人常問的問題:「如果母群體不是呈現常態分配,這樣抽樣出來,具有代表性嗎?」
觀念可以利用玩的玩出來。假設上圖是我們的母群體,你會發現這個母群體並非常態分配,而是呈現右傾斜的。如果我們一次從母群體中取出5個個體,然後計算這群個體的平均值,然後紀錄下來。做了很多次之後,這些平均值,會呈現常態分配。
不相信嗎?那到下面玩玩吧!
網址:http://www.ruf.rice.edu/~lane/stat_sim/sampling_dist/
第一個地方是母群體,我選的是skewed,你也可以自訂,愈亂愈好。接下來在第二個地方sample,選擇animated,每次取樣完,平均值會紀錄在第三個圖。你可以一直按animated,如果你懶了,也可以按animated下面的5、1000或10000。次數愈多,你會發現愈接近常態分配。
那這給我們什麼樣的啟示呢?簡單地說,母群體的期望值,是下面那個藍圖的平均值。還不懂?那再白話一點,就是只要母群體夠大,你的抽樣也到一定數量,你就不用擔心取到太極端的例子而影響到你的研究。換言之,你的抽樣是可靠的。