缩略图

基于深度学习对病理图像的分割与特征提取方法研究

作者

柳思源

沈阳师范大学

摘要: 癌症(cancer)泛指恶性肿瘤(malignant tumor),是严重威胁人类健康的疾病之一。在我 国,肿瘤发病率和死亡率正在呈现逐年上升的发展趋势。而肿瘤的切片特征提取对恶性肿瘤的 诊断具有重要意义。随着计算机断层成像(Computed Tomography,CT)以及机器学习算法的发展,利用深度学习模型对癌症患者病理图片的特征提取取得了不错的效果,但由于病理影响存在较大差异,病变组织灰度不均匀等,其分割精度仍有待提高。基于此,本项目利用深度学习算法对癌症患者病理图片进行分割,对分割贴片进行数字图片处理,提取相关特征。实验结果表明,本研究构建的图像分割与特征提取架构有良好的准确性。

关键词:深度学习;CT图像;图像分割;卷积神经网络

一、引言

1.1研究背景与意义

胃癌作为全球高发恶性肿瘤之一,其早期诊断困难与高死亡率构成重大公共卫生挑战。根据世界卫生组织(World Health Organization,WHO)统计,胃癌已是位居第五的癌症杀手[1]。深度学习的智能诊断技术已经在此领域展现出重要研究价值:首先,传统胃癌诊断高度依赖内镜活检和影像学判读,存在主观性强、漏诊率高等问题。其次,深度学习通过构建卷积神经网络(CNN)和Transformer模型,可高效分析胃镜图像、CT影像等多模态数据,精准识别微小病灶和癌变特征,显著提升早期筛查灵敏度。

二、国内外研究现状

通过机器学习或深度学习等工具对癌症影像目标检测在国内外已经有不少研究,评价方法与标准也不尽相同,主要使用的数据集有TCGA(The Cancer Genome Atlas)数据集、Full gene expression数据集、Colon Cancer数据集等。较早研究主要使用

2.1传统机器学习方法

国内黄钢的研究团队[5]对乳腺癌细胞、膀胱癌细胞、肺癌细胞进行图像切割、细胞边缘检测等处理之后,使用多种算法如贝叶斯、向量机机器学习训练检测模型,提取细胞核特征。

2.2深度学习方法

Kun-Hsing Yu团队开创性应用卷积神经网络(CNN)实现肺癌分子分型[4],通过系统评估AlexNet、GoogLeNet、VGGNet-16及ResNet-50等主流架构的性能差异,发现VGGNet-16在TCGA多中心数据集上的分类准确率最优。该研究首次证实深度特征可解码肿瘤形态学表型与转录亚型的生物学对应关系,证明深度学习可以有效捕捉到肿瘤的形态学特征。

三、基于深度卷积网络的肿瘤分割方法

3.1数据预处理

针对全视野数字切片(WSI)的数据特性,采用OpenSlide库进行多尺度图块分割(1024×1024像素),通过异步读取与并行处理技术实现高效数据流。该预处理可突破单张WSI内存限制,同时保留组织结构空间连续性,分割时采用10%重叠策略避免细胞跨边界切割,为后续模型训练提供标准化输入。

针对胃癌病理图像染色差异特性,本研究设计基于YUV色彩空间的标准化流程:首先通过BT.601标准矩阵将RGB转换为YUV,保留Y通道表征组织结构亮度信息。增强Y通道对比度后,联合U/V分量构建二维特征平面(阈值U∈[0.2,0.6], V∈[0.15,0.55]),经形态学闭运算消除染色伪影,最终通过最大类间方差法生成拓扑保持的二值图像。实验表明该处理使细胞核边缘锐度提升32%,较传统灰度化方法误分割率降低18.7%(p<0.01)。

深度卷积神经网络模型结构包括:

1)输入层:接收预处理后的医学影像,尺寸常为256×256或512×512,灰度单通道或三通道,归一化以适配模型。

2)卷积层:通过滤波器在输入数据上滑动并进行卷积获取图像局部特征。这一过程有助于降噪和捕捉单元之间的相关性。

3)池化层:对卷积层输出的特征图进行压缩和抽象,保留显著特征并降低过拟合风险,对于医学影像,减少池化层数以保留细节。池化方法包括最大池化、平均池化等。

4)全连接层:将前面层的信息展平后通过多层感知机进行整合,网络中含有大量的待训练参数,为输出层做准备。

5)输出层:将全连接层得到的一维向量经过计算后得到识别值的一个概率,取最大的识别值,就是最终的识别结果。

四、实验结果与分析

4.1数据集描述

本研究基于TCGA胃癌病理图像数据集,包含512张全视野数字切片(WSI)及像素级标注。数据经统一调整为2048×2048像素,并采用颜色解卷积技术消除染色差异。

4.2实验评价指标

使用精度,交叉熵对模型进行性能评估:

4.3实验结果分析

实验结果分析表明,本文提出的深度学习模型在胃癌病理图像特征提取任务中表现出一定的学习能力。经过50轮训练,模型在测试集上达到70%的最高分类精度,验证集交叉熵损失由初始的6.9逐步收敛至0.9,反映出特征表征能力随训练逐步增强。值得注意的是,第15轮后验证精度进入平台期,暗示模型可能达到当前架构的学习上限。交叉熵曲线的下降趋势并有有显著震荡提示改进模型需通过引入注意力机制或增大异质性训练样本进一步提升对细微病理特征的捕捉能力。

五、结语

本文简单介绍了深度卷积神经网络的各个部分及组成原理和工作原理,设计了一种为了提取更具体的特征的深度学习卷积神经网络。本文提出了一种基于深度卷积的病理图像分割的架构设计,通过对原始图像数据进行预处理、图像的数据提取、训练深度卷积神经网络模型,采用比较的方法获得较为优质的网络结构。研究中,通过深度卷积神经网络自动学习特征,去掉了人工提取的繁琐过程。

参考文献

[1]Sharma V ,Kumar A .Microsatellite-Instability-High Metastatic Colorectal Cancer.[J].The New England journal of medicine,2025,392(7):726.

[2]Holly K M ,Yan W ,Sean C , et al.Defining a patient-centered approach to cancer survivorship care: development of the patient centered survivorship care index (PC-SCI)[J].BMC Health Services Research,2021,21(1):1353-1353.

[3]臧启元,黄钢,徐磊,等.基于机器学习与细胞形态学对癌细胞分类[J].软件,2019,40(09):81-83.

(沈阳师范大学省级大学生创新训练计划资助项目 项目编号S202410166048)