承上篇讀書心得:醫護投稿實務一本通–以SCI期刊為實作範例 (一)。
第二個部分,是此書的重點,講統計分析及結果呈現。
資料輸入與統計軟體介紹
資料輸入的部分,這本書是以SPSS作為介紹,說的非常詳細,甚至提到了資料檢查的部分,這是坊間SPSS書籍較少提到的。
對於研究生來說,SPSS是比較容易上手,但我個人強力不推薦。許多人用SPSS處理複雜的資料,但又沒有養成寫code的習慣,導致結果無法再現。如果你一個資料,從開始處理到文章寫好,可能已經過了兩年了,你還有辦法重現你當初作的結果嗎?如果reviewers要你修改某一項分析,你有辦法作得到呢?
要學SPSS,你就要認識其侷限性並克服,否則一開始貪快,以後資料可能都得重作。
此外,作者在SPSS資料處理也著墨挺多,這是實務上的問題,但不少書籍也都略而不談。這裡面講的非常清楚,但我還是有些建議 (見下方第二部分建議)。
醫學統計分析導論
醫學統計分析導論這部分,包含了六小部分:變項尺度、分析的分類原則、分析總覽、敘述統計、常態分佈、P值的意義等。
這裡我挑重點說。分析的分類原則,這裡分為三大種:相關、差異或關聯分析,這是我第一次看這種分類,如果這是從文獻來的,可能加上出處會更好 。
在常態分佈部分,這本書寫了十頁!讓我非常佩服作者在這部分的用心,把一些實際操作上會遇到的細節,也作了說明。關於常態分佈,到時候我也會寫一篇文章補充書中的不足,把常用的skewness與kurtosis加上,並補上參考文獻。
另外一提,p154的 skewness打錯了,打成shewness。下一版記得更正。
在P值的部分,作者將type I error 與 type II error 講得很清楚,而且還把Power (統計檢定力) 說了一下,但沒說到怎麼計算。這部分可配合我之前寫的文章,補足書中不足的部分。
什麼是統計檢定力 (power)?
G*Power 計算統計檢定力 (一)
G*Power 計算統計檢定力 (二)
連續型結果變項分析
在社會科學領域,連續型結果變項用的比較多,也是我重點看的地方。
在ANOVA事後比較的部分,作者列出了LSD, Dunnett, Bonferroni, Scheffe的四種事後比較,裡面的表格挺清楚的,如果對其它事後、事前比較有興趣,也可以參考下面的文章:
在講操作部分,我想這本書的一個很大的亮點就是操作說明非常清楚,直接在圖裡面就指出每個部分代表什麼意思,並且把前面的觀念結合起來。 我想補充一點建議就是:像在ANOVA的部分,作者教了怎麼解讀結果,但忘了很重要一點:該如何有文章中匯報結果,結果的數字是要看哪裡,怎麼呈現。我想加上這點會對讀者很有幫助。
剩下的三個分析:類別型結果變項分析、存活分析、多變項分析建模策略,我用的比較少,就讓讀者雪亮的眼光,來評價此書了。
第二部分建議
很感謝作者對於我第一部分的評論抱持著正面的態度,我就繼續給點建設性的意見。
修改「資料輸入與統計軟體介紹」此標題
首先,第五章的標題挺令人困惑的,因為「統計軟體介紹」其實就只有介紹SPSS的操作,所以為何不把標題改成SPSS統計軟體介紹呢?
如果要說「統計軟體介紹」,那內容就必須介紹各種統計軟體,並比較其優缺點,這才是統計軟體介紹。
考慮對調醫學統計導論與資料輸入操作的部分
在講資料輸入的時候,一開始講了資料格式為數字型、字串與日期三大部分,但其實這對初學者來說,還不夠。比如說:類別變數要怎麼輸入?遺失值 (missing value) 要怎麼輸入?順序變項要怎麼輸入?
如果不知道各種變項的尺度,就直接說要資料輸入,其實跳了好大一步。所以先說變項尺度,再說資料輸入,其實比較有道理。
另外,裡面少說了在問卷裡常用的級距變項要怎麼要輸入。比如說你的問卷問了填寫者的年齡,但你問的不是實際年齡,而是像:1) 13歲以下,2) 13歲到18歲,3) 18歲到30歲。在這種情況下如何進行資料輸入,並沒有說明。這也是我建議先說醫學統計導論,再說資料輸入,會比較有道理。
加上中文註解
在頁144與之後的幾頁,在討論分析總論,講了相關、差異與關連分析,裡面加了表格來說明,但表格6-1、6-2 都是英文,加上中文會更有幫助。
另外,這些分析方式,我在此文也有簡單地說明,可以互相參照。
資料處理另列一章並加上完整範例
資料處理與資料管理 (data management) 其實很多書籍都不願意講,因為這部分太瑣碎,但我很高興這本書包含了不少重點。初學統計者千萬別小看這個部分。就我個人的經驗而言,資料處理大概會花我分析時間的50%以上,絕對不誇張。如果資料分析比較容易,不需要測試多種模型,那資料處理的時間佔所有分析時間的70%以上。
我的建議是:這部分應該自成一章,把一些實務上的例子拿出來講。比如說在第一部分結束的時候,列出一個假想的研究問題,設計研究問卷與實際,把各種需要資料處理的地方深入講講,會更具體一點。不然我相信許多初學者會跳過這部分的,其實這是很大的錯誤。
標準化係數加上效果量的說明
在178頁提到未標準化系數與標準化系數,但在非常後面,作者才又提到效果量 (effect size,也有人翻效果值),可能放在一起會比較順一點。
[thrive_megabutton mt=”立即購買醫護投稿實務一本通” st=”” color=”blue” link=”http://www.books.com.tw/exep/assp.php/chinhsi/products/0010705011?utm_source=chinhsi&utm_medium=ap-books&utm_content=recommend&utm_campaign=ap-201604″ target=”_blank” align=””]