专家痛陈AI医学影像三大难点数据规模

中科白癜风医院善行天下 http://www.txbyjgh.com/index.html

1新智元原创

三大难点:数据规模小、标注质量差、懂算法的不懂医疗

以深度学习为代表的人工智能技术将最先驱动哪一个产业或行业实现全面升级?如果这是一场赌马比赛,那么最被大家看好的快马中,一定有一匹叫做“智能医疗”。

中金公司(CICC)6月19日发布的人工智能相关领域的证券研究报告指出,语音交互、计算机视觉、认知计算等技术蓬勃发展,助推了语音录入病例、医疗影像智能识别、辅助诊疗/癌症诊断、医疗机器人、个人健康大数据等多个具体医疗应用场景取得快速突破。

对于其中的医疗影像智能识别,报告指出,目前上市公司和创业公司正在纷纷布局,整体处于商业化初期阶段。而医疗影像识别的主要难点在于数据获取、数据标注和跨学科人才积累。

数据获取:数据是深度学习算法所需的核心资源,仅掌握算法而缺乏数据无法获得较好的训练效果。现阶段,我国的医疗影像仍处于从传统胶片向电子数据过渡的阶段,大量影像资料尚未数字化,且医院之间的数据共享和互通程度较低,获取大规模的数据对业内公司是一个考验;

数据标注:在获取数据的基础上,深度学习结合先验知识对模型进行训练,训练集需要事先标注。由于大多数标注依赖人工识别,因此数据标注将耗费较大量人力和时间,在医疗影像领域获取具有高可靠性的标注数据也成为挑战之一

“AI+医疗”跨学科人才积累:在较为专业的诊疗领域,应用及平台开发者不仅要研究人工智能算法,更要对医疗影像识别建立深入了解,人工智能+医疗的复合背景人才构成核心竞争力之一。

“现在很多公布的结果都经不起推敲”

而报告所指出的医疗影像智能识别的这三个难点,也恰恰成为了这一领域发展的痛点,甚至许多行业乱象正是由此滋生。谈到这一问题,深睿医疗的CEO乔昕感触颇深。

“随着人工智能技术在医学影像领域的兴起,各种各样的国际国内大赛、评比、甚至所谓的人机大赛搞得轰轰烈烈,公布的成绩从85、90提升到所谓的95、98,令人目不暇接,各路人马高唱凯歌,大有接替医生之势。我们在为技术进步感到欣喜的同时,的确应该正确的理解和看待这些先进的科学技术。”

“首先医学是一门注重实践、依赖循症的科学。简单来说,新兴技术需要医生通过长期的实践,分析总结,找到科学依据,再通过现代统计学的科学方法结合临床实践得到最大可能的验证。这是一套完整的科学体系。”

“目前应用人工智能对某些症像的识别取得了进展,但是此项技术不论在国内还是国外都还没有开始大规模的临床验证,甚至缺乏验证的技术和科学方法。”

“一旦我们开始讨论这个问题就会发现,现在很多公布的结果都经不起推敲。首先是数据的来源和质量,再者就是对结果的评判也需要一个科学的评估标准和体系。”

“目前市场上大部分公司的数据来源是2-3家医院,这实际上数量和质量是远远不够的。以CT为例,医院在用的各种CT机型有近百种,厂家有7、8家。在产品化的过程中,如果仅使用几个机型的数据,或者下载公开数据集的数据来训练模型,即使实验室准确率很高,也很难在实际应用中取得很好的效果。这种影像数据的的差异来源于设备的设计上的不同,使用上执行标准和指南的偏差,甚至对使用成本核算上的考量。”

“另外,GE、西门子、飞利浦等公司的大型医疗设备也在不断的更新,国产品牌快速崛起,而医疗AI公司研发的产品是否可以适应市场上90%的影像设备,是这样的产品进行市场推广的前提

这一席话确实道出了困扰医疗影像智能识别发展的一些根本问题。我们这位很敢说的CEO拥有丰富的医疗知识背景。他毕业于浙江大学生物医学工程专业,先后就职于北京医院,西门子(中国)有限公司医疗部。历任西门子医疗东北亚CT事业部总经理,西门子(中国)医疗事业部大中华区副总裁,医疗服务业务领域总裁。在行业内,乔昕本身就拥有很高的声誉。

他所在的深睿医疗成立时间不长。年年初开始,百度创始七剑客之一雷鸣带领8名博士进行智能医疗影像的探索,今年年初研究成果用于所以验证后,正式成立公司并获得万元人民币的A轮融资。目前已经完成第一款用于肺癌早期筛查的医疗影像诊断系统,医院进行试用。

中金报告所指出的跨学科人才难点,恰恰是深睿医疗的一项显著优势。

深睿医疗目前已经组建了近50人的团队。科研团队主要由来自北大和中科院的博士硕士组成,工程团队由来自BAT等一线互联网公司的研发人员组成,团队成员曾在ICCV、AAAI、CVPR等顶级会议发表多篇文章。公司销售副总裁Sally.Yang(美籍)为原Terrecon中国区总经理,市场副总裁李朝阳先生为原西门子市场总监,临床科研总监信颖医学博士为原西门子医疗资深临床专家,医疗团队成员中多人拥有医学影像硕士博士学位,有着多年医学影像诊断经验,医院影像科、临床科室保持长期关系。而我们所采访到的CEO乔昕,则更是具有深厚的医疗行业背景与资源。创始核心团队人才的高度复合性,成为了投资方看好这家公司的重要原因。

“产品化比科研更难:找新的数据,找新的标注,找新的思路”

医疗影像数据的质量和标注难题,深睿医疗自然也遇到过。乔昕表示,深睿医疗的主要团队在成立前就已经在从事医疗AI产品的研发,尤其是肺结节的筛查,在公司成立的时候,已经能取得很高的准确率了。“但是在进行产品化的工作中,我们还是遇到了大量的数据差异化的问题。为了能够适应更多的使用条件,我们回过头来,从科研的角度,医院、找新的数据、找新的标注、找新的思路,然后把问题克服掉。”一路走下来,乔昕感觉产品化的难度一点不比科研的难度小。

目前深睿医疗的肺癌早期筛查的产医院数据不统一、标准不统一的问题,医院试用。

另外,乔昕补充说,他们最初的产品定位是给基层医疗机构提供服务的,基层医疗机构拍摄医院比起来,要复杂得多,质量、标准化等差距非常大,医院有较大的需求,医院得到推广,就必须要克服这些问题。这个过程需要团队有很深的临床功底,对医院的情况有很深的了解,才能做到。

“为了保证数据标注的质量,在系统训练前,数据会交由至少两位以上的资深医学专家进行标注,如果标注结果不一样,我们会再聘请一位更高资历的专家来确定标准,这样确保用于训练的数据是可信的。虽然这样做成本会更加,但这也确保了系统的准确性。”

此外,乔昕强调,目前深睿医疗没有去一味的追求使用的数量而是非常注重产品的普适性,他们在尽量用各种各样的临床数据来验证他们的产品。

“只有临床认可,AI医学影像才有价值”

作为在医疗领域深耕多年、有深厚医疗行业背景与资源的乔昕,对于AI医学影像和临床的关系有深刻认识。他认为,AI医学影像最终是服务于临床的,其真正的价值要获得临床的认可。

这一点获得了深睿医疗医学顾问金征宇教授的赞同。金征宇教授是中华医学会放射学分会候任主任委员,北京医学会放射·学分会主任委员,中国医学装备协会副理事长,中国医学影像技术研究会副会长,北美放射学会(RSNA)终身会员,中华放射学杂志副主编。他非常关心AI技术的发展,也非常认可深睿注重临床需求的发展理念。“来自临床的需求是医学影像发展的动力,而深睿医疗在这方面取得了显著的成绩”,金教授这样告诉新智元。

中华医学会放射学分会候任主任委员金征宇(左)和深睿医疗CEO乔昕

金教授说:“目前医疗数据80%以上来自医学影像数据,随着医学影像技术的高速发展,一方面海量数据为临床提供了更多信息,另一方面对影像科医生的培养和知识更新换代提出了巨大的挑战。AI在医学影像领域具有广泛的应用前景,可以辅助医生提高诊断准确性,降低工作强度,提高工作效率”

医院医学影像科主任卢光明教授

医院医学影像科主任卢光明教授对于AI医院的应用也充满了希望:“在确保数据信息标准有效前提下的医学影像AI,医院用于临床,甚至还可以结合各种组学的研究,进一步拓展医学影像信息的临床价值的边界”。

医学影像报告出具以后会传给临床医生,临床科医生会根据指南,结合患者的其他临床数据和身体特征判断患者如何进行下一步治疗,因此影像科医生必须了解临床需求,了解各种指南的临床意义,提供给临床有价值的医学影像信息是影像科医生的职责。不能臆断临床需求。这本身也是对医疗影像智能识别系统的严峻挑战。

“归根结底,医疗AI产品还是医疗产品,是医疗产品就要遵循临床指南和医学路径,不然就不会被医生接受。”乔昕说。

点击阅读原文可查看职位详情,期待你的加入~




转载请注明:http://www.aierlanlan.com/tzrz/8238.html