中山大學中山眼科中心近日發(fā)布消息稱,該中心人工智能學科團隊完成醫(yī)療AI(人工智能)醫(yī)生多中心隨機對照研究。研究顯示,AI醫(yī)生在真實臨床門診中準確率較人類醫(yī)生低,但是AI診斷耗時短,表明現(xiàn)階段的醫(yī)療AI可以在臨床上輔助人類醫(yī)生,提高工作效率。
該中心利用深度學習建立了“先天性白內(nèi)障人工智能診斷決策平臺”,把入組的兒童患者隨機分成兩組,分別進入由該平臺接診的人工智能門診和具有5年臨床經(jīng)驗的人類眼科醫(yī)生接診的??崎T診接受診斷,對比兩組醫(yī)生對先天性白內(nèi)障診斷的準確性。AI醫(yī)生在真實臨床門診中對先天性白內(nèi)障的診斷準確率為87.4%,與試驗訓練階段的準確率98.87%相比有差距,也低于人類??漆t(yī)生的準確率,表明AI在實驗室試驗的訓練結(jié)果并不能完全代表其真正的診斷能力。這一結(jié)果已經(jīng)發(fā)表在國際權(quán)威醫(yī)學期刊《柳葉刀》子刊E Clinical Medicine最新一期(2019 Mar)上。
這項研究似乎部分驗證了之前的另一個消息,IBM人工智能醫(yī)療部門沃森健康大幅裁員五到六成,其“醫(yī)療AI宣告失敗”。但消息并非完全準確,事實上不只IBM沒有放棄醫(yī)療AI的探索,世界上更多的人工智能公司和醫(yī)學研究機構(gòu)都在聯(lián)手,進一步加強這方面的研究。
不過,中山眼科中心的研究結(jié)果也再次明確了,現(xiàn)階段醫(yī)療AI還不能落地,至多可輔助人類醫(yī)生進行醫(yī)療和研究工作。
從技術(shù)上看,現(xiàn)代醫(yī)療(醫(yī)學)更適合于采用現(xiàn)代技術(shù),在科學邏輯上也更適應和吻合,即循證醫(yī)學。現(xiàn)代醫(yī)學需要通過隨機雙盲大規(guī)模臨床試驗和病例治療以獲得大數(shù)據(jù)支撐的對疾病治療效果的證據(jù)。這些數(shù)據(jù)又可以通過計算機和AI的算法學習來對有明確病因、病癥的疾病進行診治。此外,現(xiàn)代技術(shù)也日益廣泛而深入地滲透到醫(yī)療領域,如CT電子計算機斷層掃描(CT)、磁共振成像(MRI)、心腦電圖等。
因此,當世界上第一位AI醫(yī)生——沃森醫(yī)生問世之時,人們對其寄予了諸多希望,對其功能和真實效果的解讀也或多或少夸大了。但后來的一系列研究表明,對醫(yī)療AI揠苗助長的心態(tài)不可有,沃森醫(yī)生也會開錯藥?,F(xiàn)在,中山眼科中心的研究同樣發(fā)現(xiàn),醫(yī)療AI在試驗階段的準確度會更高,但在實際診治疾病時正確率會下降。
原因當然是多方面的,不過,人類疾病的發(fā)生、發(fā)展和轉(zhuǎn)歸都有無數(shù)的因素綜合交織在一起,很多疾病機理連人類都還不清楚,更何況AI學習和體驗的。致病因素不僅有生物的,如細菌、病毒、支原體等微生物,還有物理的,如聲光電、溫度和干濕度等,也有化學的,如苯并比、二惡英、各種殺蟲劑、農(nóng)藥等。而無論是生理還是病理的作用,需要在活著的生物體中才能真實發(fā)生,例如很多酶都是需要在有機活體某一范圍的溫度下才有活性,并發(fā)揮作用;有些病毒需要生物體特殊的細胞結(jié)構(gòu)才能入侵人體,如HIV入侵人體T細胞。
現(xiàn)階段除了讓醫(yī)療AI輔助人類醫(yī)生以提高工作效率外,研發(fā)和應用應當側(cè)重最容易學習也最有效果的一些領域。實踐證明,有大量標注數(shù)據(jù)、規(guī)則清楚、圖像和標志清晰、結(jié)果定義明確的疾病比較適合利用人工智能,如食道癌的診斷。此外,對于單一病種的細分領域,如心電圖的判讀,AI也有較高的準確率。
此外,AI進入醫(yī)療領域,也應有社會倫理和法律的制約。正如自動駕駛出現(xiàn)意外誰需要負責一樣,如果AI診治疾病出現(xiàn)誤診誤治誰來負責,是AI?AI的設計者?抑或是AI的操作者?現(xiàn)在,一些國家已經(jīng)在研究無人駕駛的各種問題,同樣,AI應用于醫(yī)療也需要研究相應的法律責任和解決之道。解決了倫理和法律問題,在技術(shù)有了突破后,AI才能真正應用于各種領域。(張?zhí)锟?