WFU

2019年1月13日 星期日

健保資料庫文章 2018 年之總覽、回顧與展望


文章作者:林星帆
首發日期:2019/1/14





2018 年的發表數量


筆者在 2018/7 時整理了關於健保資料庫在 2018 年的發表情形(文章連結在此),不過當時只有調查到七月份,所以在 2019 年的一開始,將健保資料庫於 2018 年的發表情形作些整總理,以及進行回顧與未來展望。

首先先來看整體趨勢,由下圖可知,健保資料庫由於在 2016 年 6 月底的時候,國衛院正式終止了申請與更新攜出健保資料的服務(網站首頁還是放著這個令人傷心欲絕的消息),而當時攜出的最新釋出資料是到 2013 年,於是健保資料庫的發表量在 2016 年就不再繼續創高峰,呈現至 2007 年以來的首次衰退。



資料來源:看見健康數據網站


接著從 2015 至 2018 這四年,大約皆維持每年 700 ~ 800 篇的總數量。接著不禁令人想問兩個問題。
  1. 是否都是發在品質較低的雜誌?
  2. 之後發表的數量是否會呈現非常劇烈的下降?


是否發在分數較低的雜誌的機會越來越高?


為了回答以上問題,筆者分別做了兩個簡單的調查。首先,筆者以 impact factor > 5 分作為高品質文章的代理變數(proxy variable)。

下圖列出最近五年的 NHIRD 發表總數量、>5 分的數量以及 >5 分佔的比例。很明顯的看出,2018 年的 >5 分佔的比例是最近五年最低,只有 10.3%(86 / 839)。





由圖可知,即使去除 2016 ~ 2018 這三年由於 Oncotarget 所造成的影響,健保資料庫發在 >5 分雜誌的比例正在逐年下降。排除 2018 年被 SCI 除名的 Oncotarget 的 14 篇文章之後,>5 分佔的比例會來到 8.6%(72 / 839),如下圖。
(若對於 Oncotarget 事件不清楚的讀者,可到此瞭解源由。)





再加上攜出資料只到 2013 年,之後不再更新,而這也會影響到某些題目的發揮,例如新藥研究。

總結一下,根據以上數據顯示,確實使用著 2013 年的舊資料,確實之後要被高分雜誌刊登的機率會越來越低


之後發表的數量是否會呈現非常劇烈的下降?


接著,如果我們手邊有國衛院的攜出資料,那麼可能會關心下一個問題:縱然發到高分雜誌的機會越來越低,但「之後發表的數量是否會呈現非常劇烈的下降?」

下圖列出於 2018 年發表在 >5 分雜誌的文章,其資料最新年代的彙整表,共計 86 篇,去除 Oncotarget 後為 72 篇。





由圖中可知,資料最新年代幾乎都集中在 2011 ~ 2013 這三年(分別為 17、15、15),然而資料最新年代在 2008 ~ 2010 年則僅有 4 篇。

因此我們可以試著推論,在 2018 年時,如果資料最新年代只有到 2010 年,則一來是驅動研究者發表的動力不足,二來則是文章被接受的機會也可能會比較低。而 2018 減 2010 是 8 年,因此或許可以假設:「發表年代與資料最新年代差距 8 年以上,就很難被接受」。

承上假設,在 2019 年時,如果使用 2011 年或更之前的舊資料,要被接受的機率也會比較低。但是如果假設正確,那麼在 2019 年整年,以資料最新年代到 2012 ~ 2013 而言,應該還會有相當大量的發表量,由歷年比例來看大約是佔三分之二,以 2018 年的 839 篇來推估,大約 2019 年會衰退至 570 篇左右,約倒退到 2014 年時的發表量。

下圖列出 2018 年發表在 >5 分雜誌的清單。其實可以看得出,幾乎涵蓋了大多數的科別,特別是其中心臟內外科與新陳代謝(糖尿病)的篇數也相當多,看的出來某些次專科對於次級資料仍是特別喜愛。





研究限制


本調查有以下幾點研究限制。

第一,Impact factor 不是唯一文章品質的指標,對於某些次領域來說,排名第一名的雜誌可能只有 3 分,例如 ENT 或外科系等。因此如果可以使用 Ranking 會更為客觀。(其實可以做到,但要一篇一篇查...查 800 篇)

第二,在 2019 年發表量的預估部分,筆者只用 >5 分的文章來估算,或許不能代表整體的文章情形。不過我們應該可以認同,發在比較低分的文章,應該使用舊資料的比例相對較高,所以這點研究限制如果成真,應該代表筆者相當程度地低估了 2019 年的發表量。(筆者希望是真的低估了 XD)


總結


如果您手中目前還有 2012 ~ 2013 的資料,切勿妄自菲薄,還是有相當的機會可以發在高分的雜誌。但倘若您手邊資料最新只到 2011 年,那麼就要慎重考慮是否要花時間與精力完成這篇論文。