胃癌是严重危害我国人民生命健康的上消化道恶性肿瘤。根据细胞形态与组织结构,传统的Lauren分型将胃癌分为肠型、弥漫型和未确定型。其中肠型约占胃癌病例的60%以上,是胃癌的最常见组织学类型。肠型胃癌发生发展的病程较长,发病率较高,常被认为是由慢性萎缩性胃炎、肠上皮化生和不典型增生演变而来。慢性炎症与肿瘤的发生有着密切的关系,有学者提出慢性炎症是许多恶性肿瘤发生的高危因素,参与恶变、肿瘤形成、发展、侵袭和转移等多个过程,被列为肿瘤细胞十大生物学特征之一。然而,炎症向肿瘤的转化具有时程长、小概率、机制复杂等特点,其内在规律迄今尚未阐明。随着大数据、人工智能等新型信息技术的兴起,促进了大批生物医学研究的突破,如何从海量的生物学数据中找到生物系统和整个机体的运行规律,成为未来最具挑战性的科学前沿问题之一。因此,如何建立新的研究方法,了解和揭示胃黏膜病变演变过程,对于预防和治疗胃癌至关重要。 近日,清影科技与上海交通大学医学院附属瑞金医院消化外科研究所于颖彦课题组合作研究的成果《Artificial Intelligence-Based Multiclass Classification of Benign or Malignant Mucosal Lesions of the Stomach》在国际刊物 Frontiers in Pharmacology 公开发表。该论文提出了一种基于深度学习技术构建的胃组织病理图像的AI诊断系统。该系统可以实现对胃组织病理图片进行从正常黏膜-慢性胃炎-肠型胃癌三种病变的全自动检测和分类。这一研究在训练数据规模和对自动化病理诊断上均具有重要的意义,是近年来人工智能图像分析在临床医学应用中的一项重要工作。 论文中使用到的胃组织病理数字化图像数据均由资深病理学专家进行标注。该算法模型集成了全视野切片(WSI)的数字化,组织切片染色的归一化、深度卷积神经网络(CNN)和随机森林分类器等关键技术。通过染色归一化,WSI图片的染色差异明显降低,节省了重新制备玻片的经济成本和时间成本,同时也实现了优化CNN模型的效果。在子图级别(图块)分类任务中,目标病变的识别准确率分别为98.4%(正常-癌变两分类)和94.5%(正常-慢性炎症-胃癌三分类)。在WSI级(整图)分类任务中,对正常胃黏膜组织和胃癌组织的识别准确率达到96.0%。 图1 切片染色图像的归一化及算法性能 该项AI用于胃黏膜病变演变过程研究的重要创新点有:探究了CNN模型是如何提取不同发展阶段胃黏膜病变的形态学特征,从而发现其演变规律;探讨了形态学特征的可视化展示。可视化的目的是展示模型所学到的隐含信息,是深度学习领域的一个重要研究方向。该研究通过梯度加权类激活映射(Grad-CAM)和显著性映射的方法显示出不同病变中所表现的子图级别特征,论文通过对模型计算结果的分析表明正常黏膜最突出的特征是黏膜细胞的致密排列,以及组织结构的规律轮廓特征。在子图级别的慢性炎症图像中,观察到正常黏膜腺体的丢失,以及类似于肠黏膜腺体的化生上皮细胞。通过Grad-CAM分析,清楚地显示了胃癌区域结构变形的腺体(图2e),并在显著性映射图像分析中观察到不规则形状的细胞质内粘蛋白液滴(图2d)。 图2 Grad-CAM和显著性映射图像可视化分析与展示 当前,利用AI探索患者预后的研究尚不多。该项研究结合临床长期随访结果探索了利用CNN模型提取关键特征胃癌进行预后分析,发现CNN模型与决策树分析相结合,利用AI提取的特征可以进行胃癌患者预后分析。将AI提取的特征与临床常规使用的TNM分期相结合,明显提高了对胃癌预后预测的准确性。由此可见,利用CNN模型不仅可以辅助对胃黏膜病变的诊断,还可以协助进行胃癌的预后预测。 图3 AI提取的前十大重要特征和生存分析研究