Missing data 資料缺失簡介
Missing data (缺失資料;亦有人翻成缺失數據) 是在研究界日益受到重視的問題,要寫grant proposal,很多補助機構都會特別要求在提案時,清楚說明要如何處理missing data。但由於處理missing data 有一定的難度,其中的概念也不太好了解,中文方面的資料也不太多。我就根據我所讀的/所懂的,儘量用淺顯的語言讓大家知道。
在一開始說明missing data之前,要先來談談為什麼要討論missing data。如果你的研究是利用survey,從人群裡取出1000位具有代表性的受試者,調查他們的行為。當你在跑multiple regression的時候,程式會自動用listwise deletion–也就是在你的分析模式裡面,如果該受試者沒有回答,就不列入model裡面,這樣的話,你的分析模式裡面的人,肯定會少於1000入,甚至小於500人。這時候問題就來了:原本1000位的受試者是具有代表性的,當分析時,你的受試者降到500位,你的sample還能代表整個population嗎?
因為這種種問題,所以了解missing data是很重要的。
Model
首先會提到model這個詞。這個詞會用在三個地方:
1.…
Missing data 資料缺失簡介 Read More »



