随着大数据时代的到来和计算机技术及设备的进步,深度学习尤其是深度卷积神经网络(convolutional neural network,CNN)在医学影像领域成为研究热点,在皮肤病影像领域也取得引人瞩目的进展。为了评估CNN对皮肤疾病影像的分类能力,北京协和医院刘洁教授团队与北京航空航天大学宇航学院图像处理中心合作,以色素痣和脂溢性角化病为例,比较CNN与皮肤科医师诊断的准确率,并对CNN错误分类的皮肤镜图像进行分析,为未来研发能准确、有效识别在体皮肤病的智能诊断系统打下基础。
研究团队
使用5 094幅色素痣和脂溢性角化病(SK)的皮肤镜图像对CNN网络ResNet-50通过迁移学习进行训练,建立CNN二分类模型,并应用该模型对30幅色素痣和30幅SK的皮肤镜图像进行自动分类。同时,95位经过皮肤镜培训的有经验的皮肤科医师结合临床皮损图片对上述CNN自动分类的60幅皮肤镜图像进行判读。比较二者的诊断准确率,并对错误分类的图像做进一步统计分析。
结果显示,CNN自动分类模型对色素痣和SK的皮肤镜图像的分类准确率分别为100%(30/30)和76.67%(23/30),总准确率为88.33%(53/60);95位皮肤科医师的诊断准确率平均值分别为82.98%(25.8/30)和85.96%(24.9/30),总准确率为84.47%(50.7/60)。CNN自动分类模型与95位皮肤科医师对色素痣和SK的诊断准确率差异无统计学意义(χ2 = 0.38,P > 0.05)。CNN错误分类的皮肤镜图像被分为3类,即特殊类型(如皮损色素含量多、角化明显),具有典型特征但存在干扰因素,具有典型特征尚找不到错误分类的原因。
图1 深度卷积神经网络错误诊断皮肤镜图像 1A:特殊类型,色素含量较多、角化明显,皮肤镜下特征显示不清晰; 1B:具有典型特征,但存在毛发干扰; 1C:具有典型特征,但因光线、角度等影响其特征不易识别; 1D:具有典型特征,尚找不到错误分类原因
综上,CNN自动分类模型在色素痣和SK皮肤镜图像的二分类任务中的表现与有经验的皮肤科医师水平相当。CNN错误分类的原因仍需皮肤科医师与人工智能专业人员共同探索。
作者:王诗琪、刘洁、朱晨雨、舒畅、周航宁、谢凤英、徐涛、晋红中
作者单位:中国医学科学院 北京协和医学院 北京协和医院皮肤科(王诗琪、刘洁、朱晨雨、舒畅、晋红中),过敏性疾病精准诊疗研究北京市重点实验室(刘洁);北京航空航天大学宇航学院图像处理中心(周航宁、谢凤英);中国医学科学院基础医学研究所 北京协和医学院基础学院流行病及统计学系(徐涛)
DOI:10.3760/cma.j.issn.0412-4030.2018.07.002
《中华皮肤科杂志》,2018,51(7):486-489
【关键词】痣,色素; 角化病,脂溢性; 皮肤镜检查; 神经网络(计算机); 人工智能; 深度卷积神经网络
文章来自:中华皮肤科杂志