李锡荣. 多模态深度学习及其在眼科人工智能的应用展望[J]. 机械工程学报, 2021, 12(5): 602-607. doi: 10.12290/xhyxzz.2021-0500
LI Xirong. Multi-modal Deep Learning and Its Applications in Ophthalmic Artificial Intelligence[J]. JOURNAL OF MECHANICAL ENGINEERING, 2021, 12(5): 602-607. doi: 10.12290/xhyxzz.2021-0500
doi: 10.12290/xhyxzz.2021-0500

北京市自然科学基金面上项目 4202033

北京市自然科学基金-海淀原始创新联合基金 19L2062

北京市科委医药协同创新专项课题 Z191100007719002


    李锡荣  电话:010-82504345,E-mail: xirong@ruc.edu.cn

  • 中图分类号: R77; TP18

Multi-modal Deep Learning and Its Applications in Ophthalmic Artificial Intelligence


Beijing Natural Science Foundation 4202033

Beijing Natural Science Foundation Haidian Original InnovationJoint Fund 19L2062

the Pharmaceutical Collaborative Innovation Research Project of Beijing Science and Technology Commission Z191100007719002

More Information
  • 摘要: 深度学习的强学习能力和高易用性使其成为当前主流机器学习算法和医学人工智能的核心技术。鉴于医学影像在健康筛查、疾病诊断、精准治疗、预后评估等诸多任务中的关键作用,用于医学影像结构分析与语义理解的深度学习正成为重要的交叉学科研究方向。在临床场景中,医生为了实现更精准的诊断,往往需要同时参考不同类型、不同模态的影像样本进行综合分析和判断。本文介绍面向此类场景的多模态深度学习的基本概念和工作原理,结合具体案例分析多模态深度学习在眼科领域的研究进展、应用情况及技术挑战,并对该技术的应用前景作出展望。


  • 图  不同类型眼科影像示例

    A.眼底彩照; B.荧光素眼底血管造影; C.超广角眼底图像; D.光学相干断层成像; E.裂隙灯照片(斜照法)

    图  多模态深度学习的3种范式(虚线方框)


    表  1  单模态深度学习在眼科领域的应用举例

    年份(年) 研究者 任务 单模态输入
    2016 Gulshan等[7] DR转诊/非转诊分类 单张眼底彩照
    2017 Burlina等[8] AMD分级 单张眼底彩照
    2018 Kermany等[9] 多病种识别 OCT图像序列
    2018 Wei等[10] 激光斑检测 单张眼底彩照
    2019 Lai等[11] 左右眼识别 单张眼底彩照
    2019 Xu等[12] 核性白内障分级 单张裂隙灯照片
    2019 Yang等[13] 视盘-黄斑联合定位 单张超广角眼底图像
    2020 Wu等[14] 异常检测 单张OCT B-scan图像
    2020 Ding等[15] 视盘/视杯分割 单张眼底彩照
    2020 Ding等[16] RNFLD检测 单张眼底彩照
    2020 Wei等[17] 眼底病灶分割, DR分级 单张眼底彩照
    2020 Li等[18] ROP检测 多张眼底彩照
    2021 Li等[19] 多病种识别 单张眼底彩照
    2021 Zhang等[20] 多病种识别 单张超广角眼底图像
    表  2  多模态深度学习在医学领域的应用举例

    年份(年) 研究者 任务 多模态输入 融合层级 融合策略
    2020 Wang等[28] 乳腺癌分类 普通超声, 彩色多普勒超声, 剪切波弹性成像, 应变弹性成像 特征层 特征拼接
    2020 Zhou等[29] 脑肿瘤患者总生存期预测 4种模态(T1、T1ce、T2、FLAIR)的MR影像 特征层 特征拼接
    2020 Chen等[26] 癌症诊断与预后预测 组织病理学图像, 基因组特征 特征层 张量融合
    2020 Jiang等[30] 胰腺分割 静脉期CT, 动脉期CT 特征层 多层次选择性特征融合
    2020 Peng等[31] 癌细胞远端转移预测 PET, CT 特征层 网络结构搜索
    表  3  多模态深度学习在眼科领域的应用举例

    年份(年) 研究者 任务 多模态输入 融合层级 融合策略
    2019 Wang等[32] AMD分类 眼底彩照,OCT图像 特征层 特征拼接
    2020 Xu等[33] AMD/PCV分类 眼底彩照,OCT图像 特征层 特征拼接
    2020 Li等[24] 特定眼底疾病识别 眼底彩照, 算法合成FFA 数据层 样本混合
    2021 Yang等[27] 多种眼底疾病识别 眼底彩照, OCT图像序列 任务层 平均得分
    AMD、OCT:同表 1;PCV:息肉状脉络膜血管病变;FFA:荧光素眼底血管造影
