WFU

2019年1月13日 星期日

健保資料庫文章 2018 年之總覽、回顧與展望


文章作者:林星帆
首發日期:2019/1/14





2018 年的發表數量


筆者在 2018/7 時整理了關於健保資料庫在 2018 年的發表情形(文章連結在此),不過當時只有調查到七月份,所以在 2019 年的一開始,將健保資料庫於 2018 年的發表情形作些整總理,以及進行回顧與未來展望。

首先先來看整體趨勢,由下圖可知,健保資料庫由於在 2016 年 6 月底的時候,國衛院正式終止了申請與更新攜出健保資料的服務(網站首頁還是放著這個令人傷心欲絕的消息),而當時攜出的最新釋出資料是到 2013 年,於是健保資料庫的發表量在 2016 年就不再繼續創高峰,呈現至 2007 年以來的首次衰退。

2019年1月12日 星期六

投稿期刊時要注意的事-時間議題(time issue)


文章作者:林星帆
本文為重新編輯 2014/10 發表在晨晰統計部落格的文章,這裡這裡



圖片來源在此


前言


我的工作主要就是協助醫師做(1)研究規劃,例如估算所需樣本數計算(required sample size)及設計妥當的研究設計、(2)統計分析,包括圖表製作及結果撰寫以及(3)投稿後的處理,包括跟 reviewers 做回覆或答辯。

這幾年的過程中學習到很多,但也發現有些資訊(跟統計沒關係的喲)我以為醫師們都會知道,結果卻是大多數醫師都不知情,因此之後我將不定期的整理並發佈一些關於醫學投稿的訊息,今天就先來個「首發」!

2019年1月6日 星期日

實驗介入成效之各種統計方法比較(下篇,GEE與LMM)


文章作者:林星帆
本文為重新編輯 2013/11起 發表在晨晰統計部落格的文章這裡這裡這裡



圖片來源:在此


處理重複測量資料的新一代統計方法


如本系列的上篇文章所述,關於實驗(介入)效果的檢驗,目前我們已經學習到了 t 檢定(獨立 t 與配對 t)、差異中的差異分析(DID)、共變數分析(ANCOVA)以及多因子變異數分析(Multi-factorial ANOVA)。

基本上這些方法都是至少在 1950 年代以前就發展完畢的工具,如果用 Google scholar 搜尋「Analysis of covariance」或「Analysis of variance」,發現從 1930 年代就有文獻在報導,而在 1930 到 1980 年代其間,其實上述這些方法在應用於實驗介入效果上並沒有太多的改變。

而一直到 1986 年,由現時陽明大學校長梁賡義教授(當時任教於約翰霍普金斯大學生物統計系)發展出廣義估計方程式(Generalized estimating equation, GEE)應用於縱貫性研究(Longitudinal data analysis),並發表於生物統計重量級期刊 Biometrika,此後縱貫資料分析就常常見到 GEE 分析的身影。

實驗介入成效之各種統計方法比較(上篇,傳統分析方法)


文章作者:林星帆
本文為重新編輯 2013/11起 發表在晨晰統計部落格的文章,這裡這裡這裡這裡這裡



圖片來源:在此


前言


在行為科學領域中(廣泛地來說,社會科學、醫學護理、運動體育、教育、管理等都可以算是行為科學)的研究,以「實驗介入」為主軸的研究不在少數。

而之所以實驗介入型的研究會一直引領風騷,主要是因為如果想要證明「因果關係」,那麼實驗法目前為止各種研究方法中最為強韌的方法,其餘研究方法例如觀察法或質性研究,都無法像實驗法如此提供這麼直接的因果推論(Casual inference)的證據。

在過去數十年間,實驗法的統計方法幾乎是由變異數分析(Analysis of variance)獨領風騷,當然共變異分析(Analysis of covariance, ANCOVA)也常見於期刊中,或甚至偶見直接以t檢定呈現結果的文章。

但這一、二十年間,有一些新的統計方法克服了舊統計方法的一些限制,而這些新統計方法又恰好可應用在檢驗實驗介入的成效分析,例如由生物統計學所發展出來的廣義估計方程式(Generalized estimating equation, GEE),或是由教育統計學所延伸的混合線性模式(Linear mixed model, LMM)。

2019年1月2日 星期三

健保資料庫(NHIRD)之資料庫串聯


文章作者:林星帆
本文為重新編輯 2014/10 發表在晨晰統計部落格的文章,這裡這裡





前言


前一篇文章中,我們已將健保資料庫所涵蓋的幾個主要檔案作了初步的介紹,接著我們介紹該如何「串檔」。

所謂的串檔就是將同一個人在不同檔案的就醫資訊作串聯,例如我們收案條件(Enrollment)是診斷糖尿病(從門診 CD 檔擷取),欲探討糖尿病人之後的醫療耗用(Utilization)及預後(Prognosis),由於病人有可能會住院進而產生費用及後續的診斷(住院費用跟診斷是 DD 檔),因此我們需要把某個病人的 CD 檔跟 DD 檔作串聯,這就是所謂的串檔,是健保資料庫最富挑戰性的部分。

健保資料庫(NHIRD)之資料庫簡介


文章作者:林星帆
本文為重新編輯 2014/8 發表在晨晰統計部落格的文章,這裡這裡這裡




前言


雖然目前國衛院發行的健保資料庫已不再發行以及更新,需進入到衛生福利資料科學中心(俗稱加值中心)進行作業,但其實加值中心裡頭的資料庫的組成結構與串聯方式與國衛院時代實為大同小異,因此本系列文章雖是介紹國衛院時代的資料庫內容,但對於未來要進入到加值中心的人員而言,還是具有參考價值。