統計分析

什麼是存活分析? (What is survival analysis?) 之一

每學一個統計方法,你都要先問自己:我為什麼要學新的方法?這方法能解決什麼樣的問題?要什麼時候用這個方法?透過這樣的學習,你才會知道什麼時候該用什麼方法。

所以先來情境假想:

一對夫妻,平均結婚多久?

這問題你可以從問卷來看:透過問卷詢問:你結婚多久了?

然而,這樣作的問題非常明顯:你詢問的時候,一對夫妻可能剛結婚,一對夫妻可能結婚了40年,但仍在婚姻狀態。你問到的「結婚多久」,不能完全反應他們結婚的長度。另外,如果有人有多次婚姻,你如何估算呢?

那多次作問卷有助於解決這個問題嗎?當然有,問題是:作了多次問卷,該怎麼分析呢?

你可能會得到下面的結果:第一個人結婚15年,第二個人有兩段婚姻,第一段有6年,第二段有13年。第三個人結了15年,諸如此類的。

survivial analysis

你會遇到幾種情形:

1) 結婚的期間完全在觀察範圍之內 (也就是在觀察期時開始與結束),這種資料稱作no censoring。

2) 你在開始搜集資料前,他們以前結婚了。這種資料叫作 left censoring。

3) 還有一種情形,像上圖第10個人的第二段,在結束搜集資料前,他的婚姻仍持續著,尚未結束。這種情況叫right censoring。

你可能會想:那到底什麼叫作censoring?你可以把它想成是代表missing data,no censoring就代表沒有missing data,left censoring就代表沒有左側資料,right censoring就代表沒有右側資料。

相關閱讀

存活分析(Survival analysis)介紹-Ⅰ~晨晰統計林星帆顧問整理:http://tw.myblog.yahoo.com/da_sanlin/article?mid=1748

什麼是存活分析? (What is survival analysis?) 之一 Read More »

Stata: 設定記憶體大小

設定Stata的記憶體是適合Stata11以前的版本。Sata 12已經可以自動設定記憶體大小了。

在Stata裡,有時候沒有設定足夠的大小,就會出現莫明其妙的錯誤,有時候告訴你是memory問題,有時候告訴你是no room。

反正,遇到奇怪的問題時,特別是單獨跑一個code可以,但很多個models跑起來就存不起來的問題,通常是記憶體大小不夠。

要設定記憶體,要先把資料清掉。

clear <br />set memory 100m, perm

perm 這個option是將這個記憶體設定選項永久存起來,只要設定一次就可以了。

建議一開始用Stata,就設定足夠的記憶體,免得以後出問題的時候,找半天找不到。

Stata: 設定記憶體大小 Read More »

Stata: 如何畫growth trajectories

如果你的資料是longitudinal data,一個人觀察了多次,你通常會想要先看看growth trajectories (成長曲線或成長軌道)。

資料如下圖所示,id是代表人,occ是每個人的第幾個觀察次數,age是觀察時候的年紀,weight是觀察時候的體重。這種資料形式叫作long format,也就是一個人有多筆觀察紀錄。

stata long format

要畫圖的話,基本指令是用graph twoway。整個程式如下:

use <a href="http://www.stata-press.com/data/mlmus2/asian">http://www.stata-press.com/data/mlmus2/asian</a>,

Stata: 如何畫growth trajectories Read More »

Stata: 產生分組序號

有時候處理資料會遇到這樣的問題:你的資料裡面,每個人都有id,但每個人的id都非常長,而且有多筆紀錄。為了畫圖的時候更容易呈現資料,你想要產生一個新的id,將每一個人重新編號,第一個人不管有幾筆資料,編號均為1,第二個人編號為2,依此類推。

怎麼作呢?其實不難,但是沒想到的時候就會不知道該怎麼作。

egen id = group(oldid)

簡簡單單一行就可以了。

參考資料:http://www.stata.com/support/faqs/data/group.html

Stata: 產生分組序號 Read More »

Scroll to Top