統計分析

將log odds ratio 轉換成effect size

在之前的文章提到過什麼是effect size, 另外一篇文章提到計算effect size的方法,裡面有個計算effect size的計算器,輸入資料之後,就能計算effect size (效應值),非常好用。
研究就是解決一連串的問題,如果你是比較平均值的差異,藉此來算effect size,這是由計算器就可以得到的。
然而,如果你的結果是odds-ratio或是risk ratio,那你用計算器只能得到log odds ratio,這個數值並不是effect size。有沒有簡單轉換公式可以用呢?
那我們一步一步來。
首先,可以到 http://www.campbellcollaboration.org/escalc/html/EffectSizeCalculator-OR4.php,開始使用計算器。…

將log odds ratio 轉換成effect size Read More »

多層次線性分析方法–HLM軟體應用

上次寫了一篇Stata: xtmixed 階層線性模式分析指令簡介,有網友詢問:為什麼不用更容易操作的HLM軟體呢?既然有網友詢問了,我當然是為了研究生2.0的網友謀福利,立刻邀請該網友分享他使用HLM的心得與操作步驟。

研究生2.0的社群,就是靠分享而茁壯。如果你有研究軟體相關的講義,或是作研究相關的心得要分享,都歡迎在facebook與版主聯繫。

另外,新成立的slideshare帳號,希望用來分享非版主作的pdf講義。有的製作者想匿名,又不想要自己辛苦作的東西浪費,所以這類東西就透過slideshare與研究生2.0的部落格增加曝光度。

廢話說完了,下面是HLM的講義~

多層次線性分析方法–HLM軟體應用 Read More »

Stata: xtmixed 階層線性模式分析指令簡介

xtmixed 是Stata裡面用來作階層線性模式 (hierarchical linear modeling,簡稱HLM) 的指令之一,這篇文章就簡單介紹一下Stata 中xtmixed 指令的語法以及如何使用。

要用xtmixed,你得先決定一下你的模式是二階層的或是三階層的。二階層的例子像是:一個學生,在不同的時間作了多次測試,所以第一層是學生自己不同時間的差異 (within-variable difference),而第二層是學生與學生之間的差異 (between-variable difference)。如果第一層不要是時間的變數的話,那另外一個經典例子就是看家庭,第一層就是每個子女,第二層就是每個家庭。

如果要三階層的話,第一層可以同樣是時間,第二層是學生,第三層是班級 (或是學校),所以第三層可以看出班級與班級之間的差異。如果要用家庭的例子,那第一層是每個子女,第二層是每個家庭,第三層是每個社區。

xtmixed 的基本語法如下:

xtmixed DV FIV || RIIV: RCIV

在裡面,DV是dependent variable,FIV 是有fixed effect的independent variable,在||之後放的是random effect,先放random intercept,:後放random slope。RIIV 是有 random intercept的independent variable,而RCIV是有random slope的independent variable。簡單地說,分組的變數,像上面說的第二層的學生,第三層的班級,或是第二層的家庭,第三級的社區,都是random effect裡面的random intercept

至於什麼是fixed effect,什麼是random effect,這說來話長,留待日後補完。

二層階層線性模式

如果以二層的例子,第一層是學生在不同的時間,第二層是每個學生,那會先跑一個什麼fixed effect都不加的unconditional模式。

xtmixed的指令大概會像這樣:

xtmixed 成績 || 學生:, mle

成績是DV,這大概沒什麼問題;|| 之後放的是random intercept,正如前面說的,這是分組的變數。

三層階層線性模式

如果是以三層的例子,第一層是學生在不同的時間,第二層是每個學生,第三層是班級,那unconditional model如下:

xtmixed 成績 || 班級: || 學生:, mle

基本上這就是xtmixed最簡單最簡單的說明了。如果要加fixed effect,就是加在第一個||與DV之間。比較複雜的留待下篇說明~

Stata: xtmixed 階層線性模式分析指令簡介 Read More »

Missing data 資料缺失簡介

Missing data (缺失資料;亦有人翻成缺失數據) 是在研究界日益受到重視的問題,要寫grant proposal,很多補助機構都會特別要求在提案時,清楚說明要如何處理missing data。但由於處理missing data 有一定的難度,其中的概念也不太好了解,中文方面的資料也不太多。我就根據我所讀的/所懂的,儘量用淺顯的語言讓大家知道。

在一開始說明missing data之前,要先來談談為什麼要討論missing data。如果你的研究是利用survey,從人群裡取出1000位具有代表性的受試者,調查他們的行為。當你在跑multiple regression的時候,程式會自動用listwise deletion–也就是在你的分析模式裡面,如果該受試者沒有回答,就不列入model裡面,這樣的話,你的分析模式裡面的人,肯定會少於1000入,甚至小於500人。這時候問題就來了:原本1000位的受試者是具有代表性的,當分析時,你的受試者降到500位,你的sample還能代表整個population嗎?

因為這種種問題,所以了解missing data是很重要的。

Model

首先會提到model這個詞。這個詞會用在三個地方:

1.

Missing data 資料缺失簡介 Read More »

Scroll to Top