WFU

2021年2月13日 星期六

攜出健保資料庫文章 2020 年之回顧與展望


文章作者:林星帆
首發日期:2021/2/13



2020 年的發表數量


筆者在 2020/1 時整理了關於國衛院時代的攜出健保資料庫在 2019 年的發表情形(文章連結在此),並預測『於 2020 年使用 2012-2013 資料來發表的論文數量應該還是很可觀,即使打六折,發表總數仍可到 >500 篇的水準』,本篇文章就讓我們來檢視 2020 年的發表情形。

2020 年的健保資料庫(包括國衛院時代至 2013 年的攜出資料以及使用 2014 年後資料的衛福部資科中心)總數為 918 篇,扣除一些 letter / correspondence to editor 以及收錄到非健保資料庫的文章,應該還有 800 篇左右。

假使這 800 篇中有二至三成是使用衛福部資科中心的資料,那麼約還有 600 篇左右的發表量,以總發表量來說是有下降,不過降幅仍然比筆者的預估來得少很多。



發在高分雜誌的比例


先前調查一樣,筆者以 impact factor > 5 分作為高品質文章的代理變數(proxy variable),以比較從 2014 到 2020 發表在高分雜誌的比例。

下圖列出最近七年的 NHIRD 發表總數量、>5 分的數量以及 >5 分佔的比例。去除掉被 SCI 除名的『Oncotarget』之後,發現 2020 年發表在 >5 分的比例又超過 10% 了(一共 106 篇)。

# 已排除 letter 以及非健保資料庫論文後的篇數


不過這 106 篇中,只從摘要就可以確認是使用 2014 年後資料的衛福部資科中心,計有 32 篇,若只計算攜出的篇數那麼大約還是跟 2018-2019 年差不多是 8%-9% 左右的比例。

下圖列出 2018-2020 年發表在 >5 分的健保資料庫論文的資料最新年代之分佈情形,在 2020 年部分,資料年度最新到 2011 年的還有 7 篇、2012 年有 15 篇而 2013 年多達 26 篇。

不過可注意到使用資科中心的文章數量,從 2019 年的 9 篇,到了 2020 年已經激增至 32 篇。


雜誌社與領域分佈


在發表 >5 分的雜誌社分佈,第一名仍以『Journal of Clinical Medicine』(JCM)的 8 篇居冠,第二名為『Cancers』以及『Cardiovascular Diabetology』各 7 篇;發表數量達 5 篇的還有癌症腫瘤的『International Journal of Cancer』、內分泌/新陳代謝的『Journal of Clinical Endocrine Metabolism』以及 JAMA 系列的開放近用的雜誌『JAMA Network Open』。

發表達兩篇以上的非常多家,大家可以自行看下圖。



接著看領域分佈,第一名是癌症腫瘤領域(計有 16 篇),第二名是不分科計有 14 篇(JCM 有 8篇、JAMA Network Open有 5 篇);接著為糖尿病/內分泌多達 11 篇,精神科也有 10 篇,皮膚科 9 篇,心臟內外科有 8 篇,另外有一本『Cardiovascular Diabetology』被歸類到心臟/糖尿病也有 7 篇;風濕免疫也有 6 篇。



展望未來


根據 2020 年發表文章的使用最新資料年代來看,於 2021 年使用 2012-2013 資料來發表的論文數量應該還是很可觀,應至少仍有 400-500 的發表量。

由上述內容可知,使用衛福部資科中心的發表文章於 2020 年已大幅上升至 32 篇(2018 年為 3 篇、2019 年為 9 篇),這邊還是僅限於發表在 impact factor >5 分的雜誌,因此事實上在 2020 年可能已經有 >100 篇的健保論文是使用資科中心的資料。

然而在 2020 年這一年中,衛福部資科中心由於設備與場地滿載,遞出許多管制措施,包含在加值分中心未來只能使用總計 12 年的門診資料(連結在此)、帳號過期後只能展延半年(連結在此)、三年的使用期限被限縮至兩年(連結在此)、同一位申請者只能同時有兩個帳號(包含已過期的正在在展延帳號,連結在此)以及又略微調漲價格(連結在此

使用資科中心的資料,無論是費用成本、人事成本以及時間成本都比國衛院攜出時代多出許多倍,結果衛福部又開始限制使用者的權利,讓我們用的更貴、用的更不方便。真的誠摯希望有志之士,可以呼籲政府正視這個問題,未來對健保資料的開放使用做更多程度的鬆綁。