統計分析

p值的迷思:顯著與非常顯著

在很多統計方法裡都會看到p值, 通常在許多期刊表格的下方都會看到*p<0.05, **p<0.01, ***p<0.001,所以就說*是顯著,**是很顯著,***是非常顯著 (這裡的顯著指的是magnitude),所以說p<.001 的效果比p<.05的好,這樣說對嗎?

要回答這個問題就要先回到p的定義。

p值 (也有人用p value) 用簡單的語言說,就是此測試結果有百分之幾的可能是由於機率的關係,再簡單一點就是出錯的機率,所以p<0.05 的意思就是此檢定小於5%的可能是由於機率。所以p value是檢驗是否有顯著差異,但不同的p值不代表顯著差異的大小。另外,p值越小,不代表就越能反駁統計假設,這僅能表示出錯的機率而已。

p值的迷思:顯著與非常顯著 Read More »

Stata: Nonparametric alternatives to conventional t tests

這一章的內容主要是從A gentle introduction to Stata作出來的筆記,加上一點點補充。這本書在 Stata書籍介紹介紹過,有興趣的可以自己翻翻。

a gentle introduction to stata
話說從頭。由於我背景不是統計系、數學系、經濟系,再加上自己莫名其妙的從作質化研究跳到作量化研究,學統計都是遇到什麼問題學什麼,結果也混得還可以。不過之前上一個Econn出身的大教授所教的課,講到event history analysis的時候,提到nonparametric,實在是被這名詞打敗了,只好再翻翻出補補基本功 (OS.…

Stata: Nonparametric alternatives to conventional t tests Read More »

迴歸分析的假設(Assumption of OLS regression)

雖然在部落格分享了不少STATA的coding,我不是專門學統計的,只是對coding有點心得,知道使用一些統計而已。不過對於統計後面的理論,總是一知半解。這或許是由於我上的統計課多半是著重推衍的過程以及之後的應用,以至於這方面沒特別強調。另一部分是讀了不少journal article,也沒看有人特別說出在跑Anova或regression前作了一些模式假設檢定的步驟,也導致我從來沒注意這些細節。

問題於是就這麼發生了。前一陣子寫了一篇文章,送給department其它的faculty作peer review,希望得到一些意見之後去投稿。得到的意見大部分是滿正面的,不過指出了不夠嚴謹的地方,沒作迴歸分析與ANOVA模式假設檢定的部分,而reviewer認為從我的descriptive statistics的表格看起來,應該是個要注意的問題。

天啊!在paper上面寫 seems like homegeneity assumption of ANOVA haven’t been met.…

迴歸分析的假設(Assumption of OLS regression) Read More »

Stata書籍特價中

最近忽然注意到,Stata的書籍正在特價!以前我寫了篇文章:Stata書籍介紹,裡面介紹了兩本我愛用的Stata工具書:A gentle introduction to StataStatistics with Stata
a gentle introduction 3rd.png

A gentle introduction to Stata 現在在Amazon特價是$44.36 (原價為$79.95,相當於打了55折)。Statistics with Stata 原價$88.95,特價為$69.20,等於打了78折。雖然在Stata上面的網站是賣$59(詳見http://stata.com/bookstore/sws.html

Stata書籍特價中 Read More »

Stata: 輸出Descriptive Statistics表格

要作統計分析,第一步通常是看descriptive statistics,但是要畫個表格那可就很麻煩了。Stata的好處就是可以讓你直接輸出這部分的表格,方法也很簡單。

如果想要跟我一起實作,可參考前兩篇:

Stata: 敘述統計(descriptive statistics)

Stata: 敘述統計(descriptive statistics)之二

預備的code如下:

use http://twtcsl.org/dataset/gss2000.dta

Stata: 輸出Descriptive Statistics表格 Read More »

Scroll to Top