人工智能在消化内镜领域的发展和应用
发布日期:2019-06-03 11:01:36 来源:中华医学信息导报 作者: 海军军医大学附属长海医院消化内科 赵胜兵 柏愚 李兆申 浏览次数:

李兆申


伴随着深度学习算法的出现,机器学习完全摆脱了人工提取数据特征低效和不精确的局限性,给人工智能(AI)的研究和发展带来了革命性的进步。在大数据的支持下,基于深度学习的AI系统对皮肤病变和糖尿病视网膜病变的图像已经具备与医学专家相同甚至更佳的识别能力,显现出辅助临床诊疗的潜力。基于深度学习的计算机辅助诊断(CAD)在消化内镜领域也受到越来越多的关注,结肠镜、上消化道内镜、胶囊内镜等内镜影像领域中卷积神经网络(CNN)具备很高的应用价值, 在识别上消化道内镜图像的解剖部位、幽门螺杆菌(Hp)感染和胃癌,结肠息肉的检测与分类,炎症性肠病的监测,识别乳糜泻和钩虫病,小肠病变检出与运动特征分类等领域取得了突破性成果。与此同时,国内外学者也逐渐注意到消化内镜领域CAD开发过程中的信息孤岛、数据收集与标注规范性、患者隐私保护与数据安全等敏感问题,着手探讨制定CAD开发与运行的行业指导意见及规范以保证辅助诊断的准确性和临床适应性,促进行业的良性循环与可持续发展。本文就深度学习与CNN 在消化内镜领域的研究现状作一综述,以期为我国智能化内镜的探索提供思路和参考。

 

结肠镜领域

结肠镜CAD 是AI 在消化内镜领域最受关注和深入的研究方向, 目前的研究主要集中在结肠息肉的自动检出和息肉性质的实时鉴别, 但绝大多数研究尚处在探索性质的临床前阶段。基于传统机器学习的CAD 依赖内镜医生提取病变特征反馈给计算机, 而这些特征提取的成败关键在于医生的理解是否与计算机所展示的息肉图像完全一致, 但不同医生及同一医生在不同时间对同一图像的理解可能会有明显不同。此外, 息肉在形状、颜色、纹理上存在的个体差异, 肠道内的皱襞、血管、结肠瓣和粪水, 观察的角度, 图像的质量, 以及肠镜视频内大量的反光都对人工提取特征的准确性有很大影响。因此, 在深度学习和CNN 出现之前,基于人工提取特征CAD 的辅助诊断效能有限, 大多数不能满足临床实际需求。近年来, 随着深度学习算法的出现, 不断有结直肠息肉自动检出和光学活检领域的突破性研究成果涌现。

1.       结直肠息肉智能检出

工科领域首先在息肉CAD 的智能检出领域开始了探索, Shin 等的研究比较了基于深度学习的CNN智能识别框架与基于支持向量机( SVM)的人工提取特征框架, 通过在三个开源的结肠息肉图像数据库(训练数据库:561张息肉和964张正常肠道图像;测试数据库: 1 9 6 张息肉和1 7 0 张正常肠道图像) 进行了测试对比, 发现深度学习相较于SVM有明显优势, 准确度、敏感性和特异性均超过90 % 。同样, IBM 公司研究团队通过CNN学习35个肠镜视频(11 802张图像)的特征,在测试中实现了86%的敏感性和85%的特异性。临床医生主导的研究中, Misawa 首先报道了三维成像的CNN可基本实时检出肠镜视频中息肉,敏感性和特异性分别达到了9 0 % 和63 % 。Urban等报道了CAD 对结肠息肉的检出性能同样优异, 受试者工作曲线下面积(AUC) 达到0.991 、准确度达到96 %。我国刘晓岗教授团队也报道了CAD 对肠镜视频中息肉检出的敏感性超过90%、特异性超过95.4%,并通过临床随机对照试验证明了CAD 可提高中国人群腺瘤检出率,可辅助内镜医生发现更多结肠腺瘤与息肉,减少漏诊。但除此之外,目前将CAD实际运用于临床的研究十分有限,提示研究人员在进一步加强学习材料的收集与质量控制和优化算法算力的基础上,尚需进一步开展大样本多中心医疗机构,特别是包含基层社区医院的临床验证, 以进一步探索CAD在结肠镜检查的可行性、内镜医生接受度,以及有效性, 促进A I 更好地与肠镜实践结合,真正实现结肠息肉的实时智能检出。

   2.       结直肠息肉光学活检

回顾性研究 日本研究人员Komeda利用回顾性收集的1200张白光内镜图像(腺瘤性和非腺瘤性各占50%),通过CNN训练获得了75%的鉴别准确度。在基于放大窄带光谱成像(NBI)图像的学习材料上,香港中文大学的研究人员结合深度学习与迁移学习算法,利用1106张正常内镜图像和826张息肉NBI 图像进行训练和验证,证明了AI对内镜医生的鉴别准确性的超越,其敏感度、准确度和精度均超过8 5 % 。临床医生主导的研究中,中国台湾的研究人员通过前瞻性采集放大NB I 图像( 1476 张肿瘤性小息肉和6 8 1 张增生性小息肉),利用深度学习结合迁移学习训练使CAD实现了96.3%敏感性和78 . 1%特异性,且用时明显低于医学专家。美国研究人员Byrne利用125枚小息肉的高清录像评价基于深度学习CAD的息肉鉴别效能,发现CAD不能够区分少部分(15%)结肠息肉, 而对剩余的106枚息肉性质鉴别的准确度、敏感性和特异性分别为94%、98%和83%, 两项研究的诊断性能都达到了美国消化内镜协会推荐针对结肠息肉开展“ 诊断- 离开”策略的基本要求,具备进一步深入临床验证和推广的价值。

前瞻性研究 尽管包括日本学者Mori在内的多名研究者均报告CAD的诊断效能能够很好地满足“诊断-离开” 策略的要求,但目前所有关于结直肠息肉光学活检的研究都是基于S VM等传统机器学习,尚无基于深度学习与CNN的光学活检性能的前瞻性实时评价。

此外, 日本研究人员Tsuyoshi等利用841例溃疡性结肠炎(UC)患者的26 304 张结肠镜图像训练基于CNN 框架CAD区分UC疾病活动状态的能力,该CAD在测试集(来源于114例患者的3981张UC肠镜图像)中对正常黏膜和黏膜愈合阶段的AUC分别为0.86和0.98,并在不同肠段显示出高度的诊断稳定性, 有望助力UC疾病分期和指导治疗。

 

上消化道内镜领域

上消化道领域CAD的研究焦点为Barrett 食管异型增生、早期食管胃癌和Hp 感染的检出。尽管目前大量临床前探索研究表明, CAD 具备良好的性能以检出这些病变,但是尚无基于临床实践的研究评价CAD 在上消化道内镜的可行性、效能和安全性。

食管癌方面, 日本学者Hirasawa首次报道了基于深度学习和常规内镜图像建立的CAD , 其实现了对食管鳞癌92 % 的诊断敏感性, 但假阳性率偏高导致阳性预测值仅为31 % 。值得注意的是, 该CAD 处理2296 张测试集图片仅需47s , 基本具备实时分析的临床运用前景。另外, 日本学者Horie 等利用82 8 4张食管癌常规内镜图片训练CNN , 其诊断食管癌的敏感性为98 % , 阴性预测值为95 % , 但阳性预测值仅为40 % 。安徽医科大学第一附属医院的研究人员Zhao 表示, 利用CAD 可实现对放大NBI图像的食管血管形态的准确分型,有助于食管鳞癌病变的早期诊断。德国学者Alanna 等报道, 利用深度学习可对Barrett 食管白光和内镜图像中食管癌诊断92 % ~ 97 % 的敏感性和80%~100%的特异性,有助于Barrett 食管患者的监测和管理。

在预测胃癌的浸润深度方面,我国周平红教授团队利用790 张胃癌的传统内镜图像建立了基于深度学习CAD,实现了对侵犯到黏膜下层胃癌76%的诊断敏感性和96%的特异性。在H p感染检测方面, 日本学者Shichijo通过利用CAD 学习32208张内镜图像实现了89%的敏感性和87%的特异性, 诊断准确性明显高于内镜医生。Itoh等利用有限的训练集和测试集也实现了相似的结果。此外,Nakashima等通过前瞻性收集同一病灶的白光、NBI 和联动成像(LCI)内镜图片作为学习材料训练CAD , 发现基于NBI或LCI的内镜图片能够明显提高预测Hp感染状态的准确性( AUC,NBI:0.96,LCI : 0.95,白光:0.66)。在内镜质控方面, 我国于红刚教授团队通过RCT证明,基于深度学习CAD可明显减少上消化道内镜检查的视野盲区, 提高了胃镜留图的完成度, 有助于上消化道内镜检查的质量控制; 同时该团队也发现CA D 可检出内镜图像测试集中的早期胃癌,其敏感性、特异性和准确度均超过90%。

 

胶囊内镜领域

胶囊内镜一次检查将产生3 万~ 4 万张图片, 在海量的检查图片中准确筛选出病变图片, 需要消耗大量的精力和时间, 并可能漏诊相当比例的病变。目前, CAD 研究主要集中于胶囊内镜图像中病变的智能检出, 以减少漏诊和节约人力物力成本。香港中文大学Jia等的研究显示, 相较于传统的机器学习,基于CN N的深度学习在10000张胶囊内镜图像(2850 张出血和7150 张正常图像) 的训练和测试中, 能够明显提高对出血灶识别的敏感度和精确度, 使其水平均超过99 % 。与之相似的是, 南方科技大学Zhou 等发现, CNN 对乳糜泻等小肠病变的识别达到了100% 的准确性与特异性。西南交通大学He 与Wu 等利用基于深度学习的CAD分别实现了对十二指肠钩虫检出84.6%和78%的敏感性。在胶囊内镜结肠息肉的智能检出方面, 香港中文大学Yuan等设计出了一种全新的深度学习图像框架, 能够对息肉智能检出的准确度达到甚至超过98%。

临床医生主导的研究方面, CAD 对小肠毛细血管扩张的识别可实现优异的诊断性能, 诊断敏感性和特异性分别达到100 % 和96 % , 而CAD 对糜烂和溃疡的检出敏感性与特异性可分别达到88.2%和90.9%。

 

机遇与挑战

伴随着A I 研究浪潮, 智能化内镜的探索不断向前迈进。在众多消化内镜领域中,尤以结直肠息肉智能检出和性质鉴别的关注度最高,研究最为深入,我国学者发表了结肠镜乃至A I 图像辅助诊断领域的首项R C T 报告, 表明结肠镜可辅助内镜医生发现更多结肠腺瘤与息肉,减少病变的漏诊; 同时也在A I 辅助胃镜检查质量控制中做出卓有成效的探索。

尽管目前CAD 辅助消化内镜病变检出与鉴别领域取得了令人鼓舞的结果,但卓越的C A D 性能需要依赖于海量的高质量标签数据,良好的学习材料是A I 学习、识别和区分病变的重要基础。CAD 仍存在许多问题:(1)各类消化道病灶图像存在明显的个体差异性,较一般医疗数据的标注难度更大;(2)内镜数据的稀缺性和孤岛效应使得目前绝大多数消化内镜领域的A I 探索没有经过系统筹划, 普遍是基于单中心有限数据集的回顾性研究, 数据异质性较大, 难以保证CAD 诊断性能的稳健性和可推广性; (3)缺乏第三方的大样本高质量数据集对不同的CAD 进行统一测试,存在模型过拟合与疾病谱偏移的风险, 难以在同一水平对CAD 的诊断效能进行客观一致的评价。为解决这些发展瓶颈,未来应该开展更多的大样本多中心前瞻性研究以建立高质量数据集和诊断性能稳定且优异的CAD 。此外, 深度学习算法有“ 黑箱” 的性质, 结果缺乏可解释性, 未来应该有更多的研究致力于解释结果的合理性, 以进一步提高CAD 诊断的安全性及临床医生和患者对诊断结果的接受度。

(摘自《中华医学信息导报》2019年第34卷第10期)




Produced By 大汉网络 大汉版通发布系统