第四届岭南眼科论坛首日全程回顾:审视眼科AI的真实现状

雷锋网按:近日,第四届岭南眼科论坛暨第二届全国眼科人工智能大会在广州白云宾馆召开。

大会由广东省医师协会眼科分会、中国医药教育协会智能医学专委全国智能眼科学组主办,中山大学中山眼科中心、广东省医师协会眼科医师分会青年委员会、广东省眼科诊断与治疗创新工程技术研究中心承办。

本届大会以“Eye+AI”为主题,共设置70多个大会报告,内容涵盖眼角膜病、白内障、青光眼、眼底病、视光学、以及人工智能、生物大数据、新型成像技术在眼科的新进展等诸多热点研究领域,邀请来自海内外知名眼科专家及人工智能领域的知名学者,旨在全方位解读眼科专业诊疗技术最新发展趋势,分享眼科与人工智能结合的研究成果,探讨“Eye+AI“的未来发展方向。

主论坛前一天,12位嘉宾从AI技术与眼科实践出发,分别做了大会报告。第一环节由中科院计算所赵地、山西省眼科医院张光华、湖州师范学院吴茂念担任主持。

同济大学附属同济医院毕燕龙

大会开始,同济大学附属同济医院眼科主任毕燕龙做了开场报告《深度学习引领人工智能技术在眼科学领域的发展》。

毕燕龙分别从医学人工智能白皮书要点、融合深度学习的人工智能技术、深度学习技术在眼科学中的应用、深度学习技术在眼科学应用中潜在的挑战展开讲述。

毕燕龙谈到,随着AI技术的发展,它将为诊前、诊中、诊后全流程赋能。

如在诊前端,AI可进行预防、筛查、分诊;诊中端,可进行临床诊断、医技、临床治疗、住院;诊后端,可实现康复护理、愈后关怀,提升服务质量、节约医疗成本、高效医院运营管理、实现医疗服务线上线下一体化、医师培训、教学。

随后,他指出,临床辅助决策系统未来在基层医院与三甲医院应用前景广泛,在基层医院,AI辅助诊断能够减少医生的误诊漏诊情况,提升医生诊断水平。而对于三级医院,AI可通过数据反馈推动诊断更规范合理,提升医生效率。

毕燕龙也谈到,虽然深度学习可应用在糖网病、早产儿视网膜病变、年龄相关性的黄斑变性、黄斑部疾病、青光眼等疾病当中。但它也存在着诸多潜在挑战,如训练数据集的确定、有效性以及测试数据集、结果的可解释性以及深度学习的临床部署等问题。

最后,毕燕龙总结到,在眼科领域,深度学习技术已经应用于多种眼疾的检测,尤其对于常见眼底疾病的彩照和OCT评估。

未来研究的关键在于评价不同的深度学习系统的临床部署方案以及成本效益,如能汇集各方力量,优势互补,资源共享,统一监管将更快速促进AI医学的发展,尽管未来仍旧有许多挑战,但深度学习极大可能在十年内影响眼科学界,乃至整个医疗界。

湖州师范学院杨卫华

第二位嘉宾是湖州师范学院人工智能重点实验室主任杨卫华,他发表了题为《智能眼科数据库建设与设想》的报告。

杨卫华介绍到,眼科数据主要有三大特点:数据量大;数据结构化、规范化;数据种类丰富。

但当前眼科数据也存在着一定的问题,如己标注数据量不大、数据质量不高、数据缺乏统一标准(质量标准、标准标准等)。

除此之外,他认为现有的眼科数据库主要存在三大问题:

  • 数据种类、形式较单一,多为图片形式

  • 数据量较小,数据孤岛,无法展现大数据优势

  • 数据标注准确性有待商榷,缺乏必要的特征关联信息

而要想建立适合当前和未来人工智能研究的眼科数据库-特征信息关联的智能眼科数据库及管理系统,所需要的眼科数据特点包括:

1.数据形式丰富,包括但不限于图片、文本、语音、视频

2.数据置较大,数据种类丰富,包括DR、白内障、青光眼等

3.数据标注结果基本准确(标注人员经过培训,标注规范)

4.数据之间存在一定关联(如同一个患者的检查图片和文本)

针对这类数据库,则需要以下思路流程进行构建:智能眼科数据库(数据量大、病种齐全、区域性广)——数据标注(多名专家标注并引入专家信任度)——智能眼科知识库(增加眼科诊断知识的关联关系及推理)。

最后,杨卫华介绍到了智能眼科数据库其分别可以应用于数据标注研究、眼科培训系统、人工智能算法训练集及验证集、人工智能系统测试(标准化测试集)、人工智评价系统、眼科疾病关联信息及知识图谱和知识库构建,以及多模态数据应用开发。

南京航空航天大学万程

随后,南京航空航天大学电子信息工程学院万程教授发表演讲《基于深度学习的图像增强》。

万程分别讲述了DR眼底图像生成方法、DR眼底图像病灶点检测、血管分割cGAN和图像增强Cycle GAN。

其中,文本至图像的DR眼底图像增强生成方法流程为:文本特征表示(以LSTM对文本描述进行编码)——血管图下采样(输入血管图像经过一系列卷积层下采样降低维度)——深度拼接(文本编码向量与血管下采样特征图在深度上进行拼接)——上采样(拼接后的特征图经过一系列反卷积层上采样得到生成图像)。

紧接着,万程详细介绍了血管分割cGAN的网络框架,其框架生成器的主网络生成眼底图像对应的血管数据,对应的子网络生成局部的血管(细节丰富)。之后网络分割的血管和标签分别与原图组成一个图像对,对多个判别网络进行训练,通过判别网络生成的类别信息更新生成网络。在这过程中,通过引入残差模块可提高模型性能,增加多尺度结构可提高校血管分割效果,而改进判别器网络结构可提高模型的判断能力。

而至于图像增强算法,主要分为三大类,分别为数据域方法(图像域算法:直方图均衡化、自适应伽玛校正;变化域算法:傅里叶变换、小波变换)、恢复模型方法(目标域参数估计:去雾、增强水下图像,如暗通道先验方法)和基于学习的方法(超分别:SRCNN、SRGAN;去雾:Cycle-Dehaze 0)。

最后,万程对Cycle GAN眼底图像增强模型结构图进行深入解读。

她指出,FakeB要尽可能地蒙骗判别,使增强后的图像更接近真实数据集B增强后的图像要求其基本结构不改变,重构的CycA应和A尽可能地相似。

北京理工大学李慧琦

紧接着,北京理工大学信息与电子学院教授李慧琦发表演讲《眼底图像处理-先验知识与数据驱动》。

“先验知识模型+机器学习”与“数据驱动的深度学习“孰优孰劣,一直以来都是医学AI研究中的热门争论议题。

针对这一问题,李慧琦通过系列的研究案例,对两种模式的效果进行对比。具体的分类任务和分类算法分别为:

一、图像分类任务

1.白内障筛查:二分类(0级、其他)

2.模糊度分级:模糊程度四分类(0级、1级、2级、3级)

二、图像分类算法

1.基于数据驱动(无先验特征提取)

2.基于先验特征:局域特征、全局特征。

经过一系列分析后,通过最终结果,李慧琦团队发现,无先验特征算法适合简单分类任务(如白内障检测二分类);而先验特征在复杂分类任务中起到更重要的作用。

基于数据驱动算法分类结果,与现有算法比较:

  • 无先验特征算法适合简单分类任务(如白内障二分类)

  • 无先验特征算法实现复杂分类任务效果有待提高

  • ResNet区分1级与2级模糊图像能力较低

而基于先验特征的眼底图像模糊度自动分级算法,其先验特征为基于医学背景知识,提取图像特征,该方法的目的则是提取先验特征,并设计特征分类器,从而实现模糊度的自动分级。

先验特征算法分类,其各种分类器,结合特征的分类结果多好于的那一模型特征;提出的EDST-MLP与DST-MLP分类器则优于其他分类器;基于先验特征的分类器方法适合复杂分类任务,若基于先验特征,浅层小规模神经网络拥有足够的表征能力,用来获得最佳分类结果。

随后,她得出结论:

l   简单的分类任务(如二分类),可用数据驱动类算法;

l   复杂的分类任务(如四分类),先验知识作用重要;

l   基于先验特征,浅层的小规模神经网络即可;

l   基于先验特征,结合不同类型特征的分类准确率高于单一类型的特征;

l   提出的 DST-ResNet与EDST-MLP算法分别在白内障检测与模糊程度分级任务中取得了现有算法的最高准确率;

最后,李慧琦概括了自己对人工智能另一种理解:人工智能中的“人工“指的是数据标注和参数调试,而智能则是先验知识(医工融合)+数据驱动。

福州大学余轮

第四位演讲嘉宾为福州大学生物与健康工程研究所院长余轮教授,发表了演讲 《远程眼底筛查中的质量控制体系与人工智能分析》。

演讲开始,余轮谈到IDx-DR的获批对整个医疗AI行业意义重大,FDA曾表示,同样是糖网筛查,IDx与医生合作的模式非常优秀,他们尝试与医生联手解决各种问题,而Google的模式总是不断与医生进行PK。相比而言,他更加推崇IDx-DR模式。

“其实,Google及国内许多AI企业的糖网筛查背后的技术原理是一个“深度神经网络黑盒子”,他们的产品更多只能检测中晚期DR,但难以检测DR的早期轻度病变,而对于严重DR、黄斑性病变、治疗方案等情况无法给予临床实际指导。”

随后,余轮谈到了AI-DR的标注问题,他介绍大,DNN有一大缺点逐渐变得越来越突显,即训练过程中需要消耗大量人类标注样本,而这对于小样本应用领域是难以做到的。但随着近几年深度学习研究和应用的深入,减少人类标注的方法得到普遍重视。

最后,余轮谈到行业为什么需要全流程的质量控制体。

他分别谈到四点,眼底图像的可用性是远程DR筛查的重要保证;无论医生或AI,高质量的图片是早期诊断轻度近视视网膜病变的重要保证;实时、持续、全流程的筛查质量控制体系和患者的隐私保护技术,让系统运行更加安全可靠;专利保护下独到的AI质控体系和25年远程判读会诊中心建设经验,面对海量市场,远程筛查市场并发规模和技术优势大。

南方科技大学唐晓颖

第一环节最后,南方科技大学助理教授唐晓颖发表了演讲《基于眼底彩照的糖尿病视网膜病变病灶检测》 。

演讲初始,唐晓颖便提出一个问题,为什么当前整个行业非常需要做一个自动病变筛查系统?

因为检测一些微小的病变如小动脉瘤即便对于高级医师来说也是一项巨大挑战

在这种情况下,如果采用自动的算法,往往会达到一个非常优秀的效果。

唐晓颖谈到, 病变检测可以看作是一种目标检测的方法,而目标检测则离不开深度学习。高质量的大数据则是深度学习解决医学问题过程中最关键的要素之一,然而在病变检测和分割的任务里,高质量的大数据却很难获取。

以眼底病变为例,如果做像素级的分割,眼底图像中的每一个有病变的像素,都需要手工进行标注,耗时耗力。

针对这个问题,唐晓颖团队和中山眼科中心团队进行了深入探讨:如果为每张图像进行像素级标注,单一张图像就至少需要六个小时。那么如何在保证减少医生标注时间的情况下,同时能得到更多高质量数据?这便是他们研究的重点。

为此,唐晓颖团队联合中山眼科中心采取了一种折中的方案,在其中一个项目中,他们主要关注出血、渗出和微动脉瘤三种病变,在这过程中,他们在想与其让医生去做像素级的分割,不如先降低综合人力成本和时间成本,让医生用非像素级的圆圈尽量把病变的区域框出来,首先这一流程是原本像素级分割耗时的六分之一。出血,团队标注了590张数据集,渗出是600张,微动脉瘤296张。

当然,粗略的分割虽然便捷,但精度相对有限。其次,某一些病变,医生在标注的时候,仍然会有很多漏标以及错标的问题。常规方法是医生,对有问题的数据再进行精细化标注,但这件事仍旧非常耗时。

所以唐晓颖团队提出一种方法,先用自动的算法对数据进行重建和图像增强等预处理,然后把数据输入至深度学习模型,去做病变检测。这过程中,也采用了目标检测中的经典CNN网络进行检测,这一方法总共分为四步,第一步是人为的进行生成数据,然后对于预处理,他们采用了CLAHE Preprocessing,去增加病变的对比度,然后会在数据中训练一个边框回归,将边框回归网络应用于实际的粗注释数据集,实现细化标注。

AI技术与眼科实践(二)

在本日议程的下半环节,6位专家学者发表了精彩报告。论坛由浙江省第一医院韩伟、海军军医大学附属长海医院彭亚军、南昌大学第一附属医院邵毅主持。

温州医科大附属眼视光中心黄锦海

首先,温州医科大附属眼视光中心主治医师黄锦海发表了演讲《精准眼科生物测量》

他谈到,由于眼的特殊性,诊疗过程中其更依赖大量的仪器设备辅助,仪器设备的研发迭代也往往非常的迅速。

眼科临床的诊断,离不开详尽的眼球生物结构测量,因其直接关系到临床诊断、治疗评估和病情随访,以及实验的敏感性、特异性、可重复性、阳性与阴性结果的理解等。所以眼球生物结构的精准测量是根基,假如没有精准的测量、计量和标定,未来的眼科AI也很难大规模推动。

无论是眼前节图像、眼后节图像、眼屈光成像质量客观分析系统还是主观或心理物理学评价方法以及功能检查类仪器,总体而言,目前大量的检查还是集中在后节上。

黄锦海指出一大现象,对于图像处理的问题,很多时候,研究团队设计的算法,可能仅针对某款设备适用,却对于其他设备并不一定兼容,这背后有系统误差和随机误差。假如两个设备之间存在随机误差,则很难做到良好的兼容,AI也难以进行正确的判断。

2013年,黄锦海团队也在JAMA上发表了一篇综述评论,他们认为现有的眼压测量技术存在一定局限的。

最后,黄锦海总结到,当前的角膜厚度的测量技术非常多,包括内皮镜、光学低相干衍射仪、光学低相干放射仪、裂隙扫描角膜地形图、OCT和旋转Scheimpflug等技术。

他更加推荐采用Scheimpfug原理的Pentacam和Sirius,以及傅里叶域OCT作为常规测量设备,这些技术能够提高重复性和再现性的测量结果,这其中,OTC的结果略小于Pentacam和Sirius。在临床使用中,Pentacam和Sirius在中央角膜厚度的测量结果可互相使用,而周边厚度差异较大,建议采用相同的设备进行测量和随访。

利用OCT进行眼后节参数测量时,单个仪器重复性良好,可以提供精准测量结果,各个仪器的扫描原理不同和图片清晰度不一致等原因,不同原理之间往往结果的一致性显示较差,再临床中往往难以互相替换使用,OCTA进行眼底血管成像时,分析单个仪器的测量结果更加可靠。

香港中文大学张艳蕾

本环节的第二位演讲嘉宾为香港中文大学眼科与视觉科学系助理教授张艳蕾,她发表了演讲《Detection of Glaucomatous Optic Neuropathy with Spectral-domain Optical Coherence Tomography: A Retrospective Training and Validation Deep Learning Analysis》

演讲开始,张艳蕾谈到了青光眼的诊疗现状,随后她重点介绍了谱域光学相干层析扫描(SD-OCT),首先传统的SD-OCT视网膜图像分析存在以下局限:

1. 手动分割会引起分割误差,影响检测的准确性

2. 其他因素可能影响基于内置不规范数据库的RNFL厚度

3.仍需要有经验的青光眼专家进行人工解释

而以往研究则主要存在以下局限性,在三维体积数据中没有使用来自其他视网膜层或更深的视觉神经的结构与GON-related 特征未参照相应的功能变化进行地面真值标注。与此同时,也仍然依赖于SDOCT自动分割生成的指标(如RNFL厚度和视网膜边缘神经)。

针对上述问题,张艳蕾团队进行了一种新的尝试,利用三维SD-OCT进行GON检测。

上海市静安区市北医院陈吉利

随后,上海市静安区市北医院眼科主任陈吉利发表演讲 《基于人工智能技术的社区糖尿病视网膜病变筛查》。

陈吉利谈到,眼底检查潜在的需求远远不能满足临床,首先是中国眼科医生非常缺乏,二、三级医院眼科医生的负担很重。其次,基层医院也缺乏眼科培训和指导。

而人工智能则是解决基层医院眼底检查的利器,AI主要用于智能阅片,如常见的眼部疾病辅助诊断:糖尿病性视网膜病变、青光眼、白内障、黄斑病变的检查和筛查,次要用于搭建远程医疗系统,构建高质量眼科诊疗平台。

随后,陈吉利介绍了上海静安北部医共体糖网人工智能筛查建设项目,其研究方法流程为:医共体就诊的MD患者——详尽告知,签署同意书——MD患者眼科数据收集——人工读片结果1与AI读片结果2——分析AI读片的名感性、特异性——对患者下一步的治疗进行指导,完善AI诊断数据及建立数据库。

根据此项目,陈吉利得出一个结论,AI在检测DR和RDR方面具有较高的敏感性和特异性,在中国社区医院使用基于AI的DR筛查模型是可行的,但不足之处则在于无法在二维眼底照片上准确地识别糖尿病性黄斑水肿。

与此同时,他们项目组也取得了一个阶段性成果,2019年8月21日参加国家食品药品监督管理局医疗器械技术评审中心组织的三类医疗器械证创新通道答辩,9月16日公示通过,中国第一款进入CFDA创新通道审批的人工智能诊断软件获得批准。

山东省眼科研究所李东芳

本环节第四位嘉宾是山东省眼科研究所李东芳,她为与会者带来演讲《基于深度学习的眼前节OCT图像角膜组织多病灶自动识别》。

首先,她介绍到了团队的研究目的,即研究应用深度学习为主的人工智能算法,基于眼前节光学相干断层扫描(OCT)图像,对角膜组织的多种病变区域进行自动识别,辅助医生读片。

研究方法则是收集了2018年7月至2019年4月于他们院Optovue RTVue100-2拍摄的眼前节OCT图片1675张,基于整体病灶分布情况,选择其中1484张图片作为训练集进行模型训练,191张图片作为测试集来验证模型性能。

每张图片经过临床医生标注和复核,共标注13类常见的异常病灶征象5237个,包括角膜上皮缺损(8.71%)、角膜上皮增厚(13.25%)、角膜变薄(6.03%)、角膜前凸(6.91%)、角膜增厚(10.65%)、上皮下水泡(6.42%)、上皮下混浊(4.37%)、角膜溃疡(5.38%)、基质混浊(20.67%)、后弹力层褶皱(4.39%)、角膜后沉积物(6.67%)、LKP术后(1.97%)、PKP术后(4.58%)。

为了定量化评估模型性能,选用准确率、灵敏度、特异度三个评测指标,依据 Youden指数,即灵敏度、特异度之和最大原则,定义各类病灶的不同检测阈值。

项目过程中,选用了Mask-RCNN深度卷积神经网络架构作为病灶检测主体网络,以ResNet50作为特征提取基础网络,结合特征金字塔和注意力机制提取不同尺度的特征表达,经RPR网络推荐候选区,最终依靠回归网络以及分类网络,优化病灶位置,并判断候选区域内所包含的病灶类型。

最终,利用191张眼前节OCT影像评估模型检测准确率,对于13类病灶检测灵敏度、特异度均达到90%左右或以上。

武汉大学人民医院肖璇

此后,武汉大学人民医院眼科中心主任医师肖璇讲述了《AI在基层卫生眼病慢病管理模式中的应用》

肖璇首先介绍到昌江医疗集团(医联体)的由来和现状,随之引出她们需要通过AI和信息化弥补基层卫生的短板:基层医生缺少慢病管理能力和所需工具设备,AI和信息化技术就是赋能基层医生,降低使用工具和设备的门槛,做到“傻瓜式”使用。

如通过视频坐诊+医生助理从而简化信息化系统对接问题,其特点为支持多病种,而非仅仅糖网显示病症,便于做患者教育和提高信任度,无缝连接FORUM数据分析工具,做好诊断和随访数据分析提知识库便于基层医生查询和学习。

AI可辅助慢病如筛查糖网、青光眼、老黄等。具体实现方法,是基于64210张眼底图像组成训练,1117张眼底图验证集,建立深度学习模型在3210张眼底图像测试集上测试结果。

她也在演讲中谈到,通过数据预测昌江实施慢病管理对医疗费用的影响。借鉴上海DR、温州青光眼“社区筛查+远程诊断+转诊治疗”眼科慢病管理的卫生经济学拟合模型,来预测昌江。

DR:10年内防止4800起疾病进展,减少229例盲,节省2146万

青光眼:10年内防止1.4万起疾病进展,减少336例盲,观察周期越长费用节省效应越大。

她也补充到,已有研究关注发达地区,但未必适用昌江,国内尚无AMD慢管研究,尚无AI已应用地区成本效益。

卫生经济学研究表明,眼病知晓率、居民筛查参与度、转诊率和治疗依从性等是直接影响慢病管理成败的关键因素,我国慢病防控主要存在知晓率、筛查率、转诊率和随访依从性不足等难点。通过模型预测,PACG转诊率每提高10%,可节约费用80万元,多防止344起进展时间度挽回19名病人。而AI聚焦主要短板,将显著提升慢病管理成本-效果。

最后,肖璇对未来做出了展望,AI技术奠基的慢管系统,需要抓两个基本点,其分别是转诊率和随访依从性,此外还需探索三个新功能:AI辅助随访病程监控、AI慢管师交护士慢病教育和个人助手用药生活方式管理。

同济大学附属上海第十人民医院高鹏

最后,同济大学附属上海第十人民医院眼科联合上海市第一妇婴保健院产科高鹏,做了《从产科病房解放眼科值班医生—“妊高症”的人工智能辅助诊断》报告。

高鹏分别讲述了妊高症和相关眼底改变、AI辅助诊断的意义、AI辅助诊断的实现方式、使用价值和应用前景。

其中,他重点介绍了一个眼底彩照检查的AI临床研究课题,联合四大合作单位来展开研究,实现方式首先是眼科医生按相应标进行特征标注,如二级分支血管动脉和静水直径、动静脉交叉、出血、棉绒斑、硬性渗出、视网膜脱离等特征。

随后对标注的特征利用卷积神经网络进行训练,同时融合多模态的信息如眼底图片信息和产科医生录入的其他信息,对照产科医生提供的最终诊断,以多模态智能和传统机器形成算法,计算用来辅功诊断的妊高症“风险指数”和“诊断概率”,为医生做参考。

最后再进行测试,这方面的数据,课题组共收集了五百例左右。在测试过程中,眼底诊断:以一定数量的标准测试集,计算灵敏性和准确性。妊高症诊断的测试是综合眼底检查、患者一般信息、病史、症状、血压、血检验、尿蛋白及其他辅助检查,给出妊高症风险指数和诊断建议,目的是实现对眼底和妊高症的诊断,从而实现持续改进的闭环,把产科、眼科、AI更好地绑定在一起,从而在一定程度上改变临床人员的工作模式:使得在产科病房实行眼底检查更加快捷,对眼底改变的分析可能更为客观、准确,综合多因素分析,辅助产科医生对妊高症的诊断。

而这个项目的潜在落地场景,主要存在于:

  • 产科专科医院:非综合性医院,无眼科专科医生配置。

  • 基层医院:无眼科专科医生配置或眼科医生资质不足

  • 远程诊疗:远程会诊,获得高级专业指导

当然,项目也存在着行业常见问题,如训练集(学习样本)能否持续获得;重度妊高症、视网膜病变样本量偏少;眼底图片的标注:工作量和标准化问题。

岭南眼科论坛大会主席袁进

12个报告结束后,本次大会主席、中山大学中山眼科中心袁进教授进行致辞。

“岭南眼科论坛已连续举办四届,这四年来,议程的很多内容在变,但有一项是不变的,那就是一直以来我们都在打造一个学科深度交叉融合的论坛。今年论坛首日,我听到了各位专家的讲题从数据库的建立,到图像的测量和分析、分割,再到AI在临床上的各种应用。我想,这就是我们本次学术交流的重要目的:从临床需求出发,去寻找AI技术的突破点,从而让两者有效融合,打造全新的医疗模式。”

注:后续雷锋网 (公众号:雷锋网) 将陆续发布本次大会第二、三日的精彩演讲内容和嘉宾专访,敬请期待。 雷锋网

雷锋网原创文章,未经授权禁止转载。详情见 转载须知