統計分析

Stata: xtmixed 階層線性模式分析指令簡介

xtmixed 是Stata裡面用來作階層線性模式 (hierarchical linear modeling,簡稱HLM) 的指令之一,這篇文章就簡單介紹一下Stata 中xtmixed 指令的語法以及如何使用。

要用xtmixed,你得先決定一下你的模式是二階層的或是三階層的。二階層的例子像是:一個學生,在不同的時間作了多次測試,所以第一層是學生自己不同時間的差異 (within-variable difference),而第二層是學生與學生之間的差異 (between-variable difference)。如果第一層不要是時間的變數的話,那另外一個經典例子就是看家庭,第一層就是每個子女,第二層就是每個家庭。

如果要三階層的話,第一層可以同樣是時間,第二層是學生,第三層是班級 (或是學校),所以第三層可以看出班級與班級之間的差異。如果要用家庭的例子,那第一層是每個子女,第二層是每個家庭,第三層是每個社區。

xtmixed 的基本語法如下:

xtmixed DV FIV || RIIV: RCIV

在裡面,DV是dependent variable,FIV 是有fixed effect的independent variable,在||之後放的是random effect,先放random intercept,:後放random slope。RIIV 是有 random intercept的independent variable,而RCIV是有random slope的independent variable。簡單地說,分組的變數,像上面說的第二層的學生,第三層的班級,或是第二層的家庭,第三級的社區,都是random effect裡面的random intercept

至於什麼是fixed effect,什麼是random effect,這說來話長,留待日後補完。

二層階層線性模式

如果以二層的例子,第一層是學生在不同的時間,第二層是每個學生,那會先跑一個什麼fixed effect都不加的unconditional模式。

xtmixed的指令大概會像這樣:

xtmixed 成績 || 學生:, mle

成績是DV,這大概沒什麼問題;|| 之後放的是random intercept,正如前面說的,這是分組的變數。

三層階層線性模式

如果是以三層的例子,第一層是學生在不同的時間,第二層是每個學生,第三層是班級,那unconditional model如下:

xtmixed 成績 || 班級: || 學生:, mle

基本上這就是xtmixed最簡單最簡單的說明了。如果要加fixed effect,就是加在第一個||與DV之間。比較複雜的留待下篇說明~

Stata: xtmixed 階層線性模式分析指令簡介 Read More »

Missing data 資料缺失簡介

Missing data (缺失資料;亦有人翻成缺失數據) 是在研究界日益受到重視的問題,要寫grant proposal,很多補助機構都會特別要求在提案時,清楚說明要如何處理missing data。但由於處理missing data 有一定的難度,其中的概念也不太好了解,中文方面的資料也不太多。我就根據我所讀的/所懂的,儘量用淺顯的語言讓大家知道。

在一開始說明missing data之前,要先來談談為什麼要討論missing data。如果你的研究是利用survey,從人群裡取出1000位具有代表性的受試者,調查他們的行為。當你在跑multiple regression的時候,程式會自動用listwise deletion–也就是在你的分析模式裡面,如果該受試者沒有回答,就不列入model裡面,這樣的話,你的分析模式裡面的人,肯定會少於1000入,甚至小於500人。這時候問題就來了:原本1000位的受試者是具有代表性的,當分析時,你的受試者降到500位,你的sample還能代表整個population嗎?

因為這種種問題,所以了解missing data是很重要的。

Model

首先會提到model這個詞。這個詞會用在三個地方:

1.

Missing data 資料缺失簡介 Read More »

Stata: 字串變成小寫

在輸入資料的時候,有時候團隊有不同人輸入,大小寫會不一致。當幾個資料檔想要match起來的時候,就會match不起來。這時候,不妨將資料全部標準化,字串全部變成小寫。

這部分很簡單,一個變數只要一行就可以搞定。如果原本的變數叫name的話,那一行程式就是:

replace name = strlower(name)

這樣就可以解決大小寫不一致的問題了。

Stata: 字串變成小寫 Read More »

計算 Effect Size:p 值顯著了,還要看什麼?

「你的結果 p < .05,但 effect size 呢?」

這是我在回審稿意見時,最常打的一句話。

很多研究生花了大量時間讓 p 值顯著,卻沒想到審稿人還想看一個數字。為什麼?

p 值告訴你「有沒有」,Effect Size 告訴你「有多大」

p 值受樣本數影響極大。樣本夠大,幾乎任何差異都能顯著。

但「顯著」不等於「重要」。一個 0.1 分的差距,樣本大到一定程度,p 也可以 < .001。

Effect size 才是真正告訴你:這個效果,在實際上有多大、有多重要。

最常用的 Effect Size:
Cohen's d 效應值解讀標準
Cohen’s d

適用情境:兩組平均數比較(如實驗組 vs 控制組的後測差異)

公式:

d = (M實驗組 − M控制組) ÷ SD合併

其中 SD合併的算法:

SD合併 = √[(SD實驗組² + SD控制組²) ÷ 2]

📊 舉例:M實驗 = 24,M控制 = 20,SD實驗 = 5,SD控制 = 4

  • SD合併 = √[(25 + 16) ÷ 2] = √20.5 ≈ 4.53
  • d = (24 − 20) ÷ 4.53 ≈ 0.88

怎麼解讀 d 值?

Cohen(1988)提供的參考標準(教育研究中常用):

  • d = 0.2 → 小效果(small)
  • d = 0.5 → 中效果(medium)
  • d = 0.8 → 大效果(large)

⚠️ 這只是參考值,不同領域有不同的基準。教育研究中,d = 0.4 就已經算有實務意義了(Hattie, 2009)。

懶人計算工具

不想手動算?這個線上工具直接幫你算:

🔗 Campbell Collaboration Effect Size Calculator

把平均值和標準差輸進去,直接出 d 值,還支援多種計算方式。

其他類型的 Effect Size

Cohen’s d 只是其中一種。依統計方法不同,有不同的 effect size:

  • r(相關係數):r = 0.1 小,r = 0.3 中,r = 0.5 大
  • η²(eta squared):ANOVA 用,說明組間變異佔總變異的比例
  • ω²(omega squared):比 η² 更保守的版本,大樣本推薦
  • Odds Ratio:邏輯回歸、勝算比分析常用

meta-analysis 中計算 effect size 的方式更複雜,建議參考 Borenstein et al.…

計算 Effect Size:p 值顯著了,還要看什麼? Read More »

Scroll to Top