上海2017年7月4日電 /美通社/ -- 6月29日-30日,2017真實世界研究峰會在上海舉行。來自醫(yī)療研究國內外的醫(yī)學界專家學者從大數據的建立分析到藥物研發(fā)和政策制定;從真實世界數據的高效收集到大數據在精準醫(yī)療中的應用,展開了一場關于真實世界研究的前沿交流。
對于真實世界研究(Real-World Study,以下簡稱RWS),有專家稱,這將是未來研究的趨勢,相對隨機對照試驗(Randomized Controlled Trial,以下簡稱RCT)而言,RWS的研究范圍更廣,更具有代表性,能夠真實地反映研究的情況。
但真實世界研究需要大量的研究樣本,甚至多中心事件,收集數據難度高,工作量龐大;數據異質性強,對統(tǒng)計方法的要求比傳統(tǒng)研究更高;真實世界研究是輕設計、弱干預。因此,真實世界數據,包含了很大的不確定性,以至于分析的時候,難以有效的去除混雜因子。面對如此多的問題,RWS似乎顯得舉步維艱。
在演講環(huán)節(jié),杏樹林首席數據官孫文亮給出了答案。孫文亮指出:針對真實世界研究,杏樹林依托于病歷夾產品,進行了三個方向的深度設計與開發(fā) -- 建立系統(tǒng)、構建智能和大數據。
在建立系統(tǒng)方面,病歷夾從數據采集、數據清洗到數據分析的全流程進行構建。
應對真實世界多種多樣的數據,首先要求數據采集工具必須支持從文本、到語音、到圖片視頻的多種形式的數據。病歷夾不僅做到了,而且在隨身設備方面,也對接過血壓計、血糖儀、風流速儀、心率監(jiān)測儀。目前隨身設備的數據,可以顯著提升采集效率和質量。
而真實世界的數據不像臨床試驗一樣,經過嚴格的設計和干預,因此數據不夠干凈。而數據清洗方面,杏樹林對接了專業(yè)醫(yī)療調教的語音識別系統(tǒng),能夠準確將語音中的醫(yī)學詞匯、藥品名稱、甚至中藥多音詞,轉化為文本。
最后,杏樹林通過專業(yè)的醫(yī)學設計團隊,包括文獻翻譯解讀、試驗設計、衛(wèi)生統(tǒng)計等方面的人才對真實世界數據進行分析,有效去除混雜因子,從而為真實世界研究的落地實施,打好基礎。
相較于臨床試驗數據,真實世界數據是持續(xù)不斷產生的。如何更持續(xù)高效地處理數據,成為擺在病歷夾面前的又一個命題。孫文亮表示,智能是真實世界處理的核心能力。病歷夾5年、300多萬份病歷的處理經驗積累,通過多環(huán)節(jié)的優(yōu)化配置,為構建人工智能,提供了良好的基礎。目前,病歷夾已經摸索出了一套“機器+人工”的智能處理方法。
活動中,孫文亮還以銀屑病、慢性粒細胞、疑難病的實例出發(fā),結合智能大數據功能,闡釋了杏樹林在真實世界研究領域的相關成果和應用。