June 2010

Stata: 切割字串

今天拿到一個要分析的問卷,不看不知道,一看快昏倒,裡面有一題問卷的回答像下面一樣:

1.png

變數裡面全部是 string,這也就算了。一個 string 裡面包含了五個問題,每個問題有五個選項,這還讓不讓人活啊?這樣是沒辦法跑任何分析的,得先將五個問題分開,然後再將五個答案分別 code 成 1-5,這才有辦法作分析。

雖說有萬般的不幸,但這資料裡面有個好處:格式差不多。像下面一樣:

問題.=…

美國留學生申請加拿大旅遊簽證懶人包

這幾年在美國,剛好有幾次申請加拿大簽證的經驗,所以作一個筆記,免得我這糊塗鬼下次申請時又忘了。

由於我自己是參加研討會,所以是辦旅遊簽證。用加拿大政府的專業術語來說,這叫 temporary resident visa,我作的 checklist 如下。

  • 申請表:Application form for a Temporary Resident Visa (IMM 5257 PILOT PROJECT)
  • 跟兵役有關資料:IMM 5257 Schedule 1
  • 有效護照
  • 美國 Visa
  • I-20 (如果是 F1 的話,記得 I-20 最後一頁要先拿 travel signature)
  • I-94 (出入境資料)
  • Money order $75 塊 (single entry):這要去銀行先購買的
  • 研討會邀請函
  • advisor letter (說會付你錢去開會,你會回來的)
  • department letter (說你的註冊狀況)
  • 成績單
  • 存款證明
  • 往返機票
  • 旅館 reservation

詳情請見這裡:http://www.canadainternational.gc.ca/los_angeles/imm/visa_temp.aspx?lang=eng#APPLICATION

Endnote X4 功能預覽

今天看到 EndNote 的網站公佈了 EndNote X4 的新增功能,真令人期待啊!感覺才用 EndNote X3 沒多久,新版就出了,有許多不錯的功能。

  • PDF 匯入:可以直接丟進 PDF 檔,EndNote 幫你找出這筆書目。這相當於: Zotero: 丟入PDF,自動擷取書目 ,可見 Zotero 確實給 EndNote 不少壓力。
  • 整個 PDF 資料夾匯入:就是上個功能的進階版,把整個資料夾丟入
  • 搜尋 PDF 內容:匯入的 PDF 檔也可以搜尋了。
  • APA 6th 完整支援
  • 文獻 edit 與 manage 界面整合
  • Hyperlinks between in-text citations and related references in the bibliography。在線上出版的時候,讀者可以點 citation,就跳到最後面的 reference,這真的是超方便的!
  • 加強 EndNote Web

簡介在這:http://www.endnote.com/enx4info.asp

Stata: 產生累積次數分配

網友問到:「哈囉,想請教版主有關STATA的問題,如果我想產生一個新變數,而這個變數為另一個變數的累積次數分配,應該怎麼寫此一指令呢?用ta X(變數) 可以得知變數分佈情況,後學所學的指令可能不足,故想請教版主是否知道? 謝謝」

首先,先使用一個資料庫:

sysuse auto, clear

tab 一下結果:

1.png

之後先產生次數分配:

bysort rep78: gen freq = _N

檢查一下結果:

list rep78 freq in 1/20

2.png

這還只是該值的頻率而已,還不是累積次數分配。如果要作累積次數分配,還得加工一下。

by rep78: gen cumfreq = _N if _n == 1

這一行是說,rep78 每一個值的第一筆資料,cumfreq 的值都設為 rep78那個值的次數。如果是該值的第二筆,那就會設成missing。結果如下圖。

3.png

接著下一步,就是把這些值加起來。

replace cumfreq = sum(cumfreq) if !mi(rep78)

中介變數(mediator)與調節變數(moderator)

如果你是作心理學的,分析裡用到 multiple regression,一定會想遇到中介變數 (mediator) 與調節變數 (moderator)。談到這些,就不由得談到 Baron and Kenny (1986) 這篇文章。這篇文章多有名?根據 google scholar 的計算,這篇文章已經被引用了 18901了!這篇文章主要談及中介變數 (mediator) 與調節變數 (moderator) 之間的差異,今天我就來試著解釋這兩個觀念。

中介變數 (mediator) 顧名思義,指的是 IV 對 DV 的影響,這個影響 (一部分) 是透過 mediator 的。換言之,mediator 可解釋一部分 IV 對 DV 的影響。這三個變數的關係如下圖所顯示。要測試是否有 mediation,必須用 multiple regression 或 path analysis。步驟如下:1) 先要有 IV –> DV 的關係 (還沒放 mediator進去),如果 IV 對 DV 沒影響,沒必要想中介變數的。2) IV 跟 mediator 之間要有顯著關係 (下圖 b的地方)。3) mediator 和 DV 之間有顯著關係 (下圖 c的地方)。4) 同時把 IV、DV 和 mediator 放進方程式中,三者的關係都要呈顯著。

寫成方程式的話,依次為:
1)  DV = b0 + a * DV
2)  Mediator = b1 + b * IV
3)  Mediator = b2 + c * IV
4)  DV = b3 + a * IV + c * IV

Mediator

幸運的話,你會發現:當只看 IV 和 DV 的關係時,這個 coefficient 比較大;當把 mediator放進來,IV 對 DV 的 coefficient 變小了 (但有可能還是顯著) 。這就說明了其中有 mediation。

調節變數 (moderator) : 調節變數也會影響 IV 和 DV 之間的關係。IV 和 DV 之間的關係會因為 moderator 的值而改變,有可能是 moderator 是 0 的時候,IV 跟 DV 的關係很強,但 moderator 是 1 的時候,IV 跟 DV 的關係就不顯著了。

moderator

Moderator 可以是 qualitative 的 (如:性別、種族、階級),可以是 quantitative 的 (如:得到不同程度的獎勵),這 moderator 可能會影響到 iV 對 DV 影響的方向 (男生則有影響,女生則無影響) 或是強度 (對男生來說,IV 對 DV 的影響比對女生來說,IV 對 DV 的影響來得大)。如果熟悉 ANOVA 的話,moderator 就是裡面分析會看到的交互作用 (interaction)。用圖示的話,就像下圖一樣。在 regression 的方程式中,要將 IV、moderator 和 IV 與 moderator 的乘積 (對,就是兩個變數乘起來) 放進去。如果要測試有沒有 moderation ,只要看下圖 c 是否為顯著即可。a 或 b 可能為顯著或不顯著,這並不影響測試 moderation。另外,在 moderation 中,moderator 應該與 IV 或 DV 都沒有相關性的

moderator2

另外一個 moderator 的特點是:moderator 與 IV 是在同一個層級的,也就是 moderator 其實也可以當作是一個 IV 來看待。

兩者比較一下中介變數看的是 IV 透過何種機制 (也就是 mediator) 影響到 iV;調節變數看的是將將 IV 分成幾個小組,各小組中 IV 對 DV 有不同的影響。

要選擇 mediation 或是 moderation 呢?Baron and Kenny (1986) 的文章提供了很實務的建議。如果 IV 與 DV 之間的關係很強,你可能想要用 mediation 解釋 IV 是如何影響 DV的;如果 IV 到 DV 之間的關係沒那麼強或是不一致,你可能會想要看 moderation,來看 IV 對 DV 的影響是不是受到其它變數的影響。

延伸閱讀
Baron, R.…

Scroll to Top
Verified by MonsterInsights