科技 新浪科技 醫療數據非結構化廣泛存在 醫療AI落地待解

醫療數據非結構化廣泛存在 醫療AI落地待解

新浪科技 2018-05-17 01:54

  本報記者  盧杉  蘇州報道

  「2020年,中國的數據量將佔全球的20%,成為世界第一數據資源大國。」飛利浦大中華區CEO何國偉日前對21世紀經濟報道記者表示,但健康醫療數據大多為非結構化,為AI發展帶來挑戰。

  中國不缺乏醫療健康數據,但各種原因造成數據「誤入誤出」,80%以上為非結構化的(全球為75%),不能直接使用。比如,各醫院都有自己的IT 系統,把不同的平台集成起來是極大的挑戰。

  得益於存儲技術進步、晶元承載能力及醫療資源壓力增大等,AI在醫療領域的應用成為資本追逐的熱點。

  AI與醫療影像結合最先獲得突破,2017年浩悅資本醫療行業報告稱,2017年,國內AI影像領域的交易約30筆(2016年為8筆),總交易額超過27億元,且多數集中在天使輪、A輪。

  此外,AI在患者數據、藥物研發中也嶄露頭角,國外一批利用AI及機器學習的藥物研發公司的產品,被大型公司採用,如AI輔助篩查早期癌症。2018年也被認為是AI在醫療領域更多成果落地應用的一年。

   數據難題

  醫療數據量巨大,數據類型複雜,到2020年,醫療數據將增至35ZB,相當於2009年數據量的44倍。

  患者數據包含病歷報告,診斷和治療過程中的生化、影像、病理等生物學信息。醫療數據的增長速度和多元化程度遠超目前對數據的分析能力。但龐大的數據本身沒有意義,將「大數據」轉化為「大見解」,才對醫療系統有價值。

  由於龐大的患者數據和市場規模,中國將成為AI醫療應用的中心之一。

  何國偉認為,與AI將取代人工這種預測正好相反,AI對中國醫療健康行業就業的影響微乎其微,卻能促進政府為民眾提供平等醫療服務。

  AI健康醫療產業的市場也被看好,據何國偉出示的數據顯示,中國醫療AI市場規模2016年達到96.61億元,估計2017年超130億元,並有望在2018年市場規模達到200億元。

  但數據也是中國市場面臨的第一大挑戰。中國醫療健康數據80%以上是非結構化數據。但深度學習需要結合先驗知識對模型進行訓練。例如「AI+影像」的訓練主要依賴高水平醫生對影像數據的精標,從而讓機器學習對病灶的識別。只有與臨床經驗豐富的醫生合作,才能訓練出「聰明的人工智慧」。

  醫學是一門注重實踐、依賴循證、關係生命質量的嚴肅科學。AI醫療從數據的來源、建模、訓練到結果的評判都需要科學評估標準和體系。目前,很多AI醫療公司處於與醫院「科研合作」免費試用的方式獲取有限數據階段,開始規模性臨床試驗的並不多,有些甚至還沒有找到驗證的技術和方法。

   落地待解

  如何獲取數據、避免交互污染直到轉化成有效的應用,是目前各家AI醫療需要攻克的難題之一。

   IBM 持續開發Watson Health,並先後收購Explorys、Truven等公司持續布局;Google收購DeepMind成立DeepMind health,與英國NHS、皇家自由意願合作開發輔助決策、視覺疾病機器學習; 微軟 發布醫健計劃Hanvoer,輔助精準用藥、精準治療; 阿里 發布ET醫療大腦; 騰訊 投資碳雲智能、思派網路等醫療人工智慧公司; 百度 宣布要做醫療大腦等。

  除了互聯網巨頭們入局,傳統醫療行業也紛紛入場。

  飛利浦在蘇州「全球人工智慧產品應用博覽會」上首次面向行業發布了AI技術在現有產品和解決方案中的應用成果。2015年,飛利浦將照明業務拆分出來獨立上市,並通過10多筆收購,加速完成在「健康科技」領域的布局。

  「數據處理是我們作為傳統醫療設備供應商的巨大優勢。以申康機構為例,過去16年,38家上海頂級醫院的數據基本上由申康管理,但發現無效數據非常多。」飛利浦大中華區整體解決方案中心臨床科學高級總監周振宇對21世紀經濟報道表示,比如圖像採集、圖像人工處理到圖像問題發生,都存在不同品牌的數據整合,例如GE、西門子、飛利浦的數據。我們是最有可能在整個流程上對數據進行整合和規範化的公司,國家後續也會在這方面給出更好的指南,對不同品牌的數據統一化提供指導。飛利浦現在要實施AI在醫學影像數據以及醫療數據方面的整合,必須從數據採集到數據清洗、模式更新和臨床應用著手。」

  在與人工智慧的結合中,醫學比其他領域更為複雜,僅醫學影像就可分為2000多個病種。何國偉指出,AI在健康醫療領域將數據轉化為洞察的流程,是從數據獲取、數據結構化、建模、到反覆應用驗證、比對結果、不斷改進。

  由於醫療數據中有90%來自醫學影像,AI醫療影像成為人工智慧醫療最熱門的分支。在中國醫學影像的數據正以30%的年增長率逐年增長,給醫生帶來巨大挑戰的同時,計算機視覺的深度學習方法日漸成熟,為實現醫學影像的自動分析及輔助診斷提供了新契機。

  目前,深度學習方法的研究集中在肺癌、肝癌、乳腺癌、阿爾茨海默症等。

  「影像科室更多地依賴技術創新,越來越多的技術可以對人體的信息進行定量描述,通過不同的測度來對疾病進行定量刻劃。無論哪個臨床科室,基於影像作為診斷和治療的依據是非常重要的,再延伸至病理、血液等其他體征數據來做判斷。」飛利浦大中華區整體解決方案中心總經理陳勝裕對21世紀經濟報道表示,AI應用在成像信息中可以更加科學地從定量和定性兩方面體現出病灶情況。「但從影像數據來源看,我國仍處於從傳統膠片向電子數據過渡的階段,大量影像資料尚未數字化,且醫院之間的數據共享和互通程度較低,獲取大規模數據是一大瓶頸。」

  落地的另一難題來自監管制度的配套和創新,越來越多的政府監管正走向開放。今年4月,美國FDA批准了首款使用人工智慧檢測糖尿病患者視網膜病變的醫療設備IDx-DR。FDA局長Scott Gottlieb近日在華盛頓舉行的2018 Health Datapalooza大會上也表示在保護患者的前提下,FDA正在擴大數字醫療工具的機會,並積極開發新的監管框架,用新的方法來審查人工智慧。

  FDA預計未來幾年將會有越來越多基於AI工具提交審核申請,首當其衝的是醫療成像設備。FDA對AI的態度也將著重關注其處理現實世界數據的方法,包括來自病理幻燈片、電子病歷、可穿戴設備和保險索賠數據的結構化和非結構化數據。

支持按個讚↓

我讚過了 繼續看文章!