摘要:近年来,基于局部窗口的Self-Attention机制在视觉分类任务中表现突出。然而,由于存在感受野有限和建模能力弱的问题,其在处理复杂数据时效果不佳。肺部CT图像中的特征复杂多样,包括结节的形状、大小、密度等,给深入挖掘数据中的深层次特征带来挑战。针对这些问题,文中提出了一个全新的双向多层级交互网络模型Bi-directionalMulti-levelInteractionVisionTransformer(Bi-MIViT)。该网络通过双向多层级交互机制有效融合空间和通道信息,从而显著提升特征提取的准确性和全面性。在Transformer分支中,引入了高效的级联组注意力机制,旨在丰富注意力头特征的多样性,并增强模型对关键信息的捕捉能力。同时,在卷积神经网络(ConvolutionalNeuralNetworks,CNNs)分支中,通过设计DPblock,并利用点卷积(Point-WiseConvolution,PW)和深度卷积(Depth-WiseConvolution,DW)深入挖掘局部信息,以优化模型的表达能力。此外,深度特征提取模块(DeepFeatureExtraction,DFE)的建立增强了特征传播和复用,提高了数据利用效率,实现了实质性的性能改进。实验结果显示,在公开的COVID19-CT数据集和私有的LUAD-CT数据集上,所提算法优于对比的8种方法,实现了准确分类。
加入收藏
1、引言
在全球范围内,肺部疾病已成为严重威胁人类健康的主要因素之一.在21世纪,因肺癌、新冠肺炎等肺部疾病而死亡的人不计其数.肺癌是全球癌症相关死亡的主要原因之一[1],而肺腺癌是其中最常见的亚型之一,占比约40%,对患者的生存率有着显著影响.另一方面,新冠肺炎作为一种全球性流行病,迅速蔓延,给全球卫生系统带来了巨大挑战,对肺部健康造成了严重威胁.对新冠肺炎和肺腺癌病理分型的诊断判别是指导其治疗策略及评估患者预后的关键.
过去几年,VisionTransformer[2](ViT)及其变体[3G8]在计算机视觉领域展示了卓越的性能,通过使用多头注意力机制进行远程建模,实现了全局感受野覆盖.然而,它相对缺乏卷积神经网络中的归纳偏置,并且表现出相对较弱的泛化能力,弥补这一缺陷需要大量训练样本和数据增强策略.在处理中小型数据集时,ViT常常难以完全提取数据中的潜在规律和特征,这最终会影响其测试性能.为了应对这些挑战,SwinTransformer[9]利用基于窗口的多头注意力(WGMSA)引入归纳偏置,同时降低计算成本.然而,它的注意力主要集中在局部窗口内的信息,这导致其感受野有限,难以充分理解全局和局部信息之间的相关性.类似地,Twins[10]也利用局部窗口来提高效率.为了便于跨窗口通信,该方法对整个图像中采样的特征进行额外的自关注计算.同样,ShuffleTransformer[11]利用局部窗口并通过转换补丁进行跨窗口通信.然而,这些局部注意力模型只利用了图像空间局部性.MFELA[12]提出了基于全局和局部分支的增强局部注意力,但性能受数据质量的影响较大.ELSA[13]提出了包含Hadamard注意力和ghosthead的增强局部自注意力,QnA[14]提出了新的移位不变局部注意力层,但这两种方法仍难以捕获远程依赖关系.总之,虽然每种方法都对解决ViT的性能限制或有效地捕获远程依赖关系做出各自的贡献,但在远程建模能力与多尺度信息融合方面仍有进一步改进的空间.为了扩大局部窗口自注意力的感受野,提高其在中小型数据集上的性能,本文介绍了一种基于CNN和Transformer双并行分支的双向多层级交互的网络BiGdirectionalMultiGlevelInteractionVisionTransformer(BiGMIViT).本文提出了一个创新的双向多层级交互模块BiGdirectionalMultiGlevelInteractionModule(BiGMIModule),以解决局部窗口自注意力感受野有限的问题.在该模块中,Transformer分支采用高效的级联组注意力(CascadedGroupAttention,CGA)[15],通过融合不同分支的通道和空间信息,增强了注意力头输入特征的多样性.卷积神经网络分支采用以PW[16G17]和DW[18G19]为核心的DPBlock结构,有效提取图像中的局部特征.PW主要负责通道维度上的信息整合和转换,而DW专注于捕捉空间维度上更详细的纹理和边缘信息.针对ViT在中小型数据集上性能不佳的问题,本文设计了一个深度特征提取(DeepFeatureExtraction,DFE)模块,以实现特征充分利用,有效挖掘图像中的潜在信息.本文算法充分融合了通道和空间信息,增强了特征提取能力,为解决局部窗口自注意力感受野有限的问题提供了新的途径.综上所述,本文的主要贡献如下:
1)提出了一个基于CNN和Transformer的双向多层级交互网络模型,为Transformer和CNN分支的通道和空间维度提供了互补线索.
2)设计了深度特征提取(DFE)模块和双向多层级交互(BiGMI)模块.前者在模块内的不同层之间建立了紧密的连接,有助于增强模型捕获信息的能力.后者则利用双向多层级通道交互和空间交互,解决了局部注意力感受野有限的问题.
3)从多家医院收集并创建了一个新的肺腺癌数据集(命名为LUADGCT),其中包括来自234例临床病例的8956个CT切片,分为两类:肺微浸润腺癌(MIA)和肺原位腺癌(AIS).
4)在公开的COVIDGCT数据集和LUADGCT数据集上进行了大量实验,结果表明,本文算法优于现有的8种方法,实现了肺部CT图像的准确分类.
2、本文方法
本章将先介绍BiGMIViT的总体流程和具体结构.然后,本文将详细解释所提出的DFE模块和包含双向多层级交互的BiGMI模块,并分析这两个模块的特点和优势.需要注意的是,BiGMI模块通过逐层交互融合两分支的信息,有效捕捉和利用不同通道和空间之间的关联,为两个分支的特征学习提供了互补的线索.
2.1整体结构
图1给出了所提方法的总体架构.本文设计了一种用于细粒度特征提取和重建的DFE模块.首先,该模块采用密集连接[20],允许每一层直接接收来自前序所有层的输出,从而实现对图像信息的全面提取.然后,利用反卷积结构[21]对特征图进行重构,并将其恢复至原始大小,以优化后续模块对图像特征的学习效果.接着,将重构的特征图送入BiGMI模块,该模块包含CNN和Transformer两个并行分支.在CNN分支中,处理后的特征图被完整输入以捕捉图像的局部细节特征.然而,在Transformer分支中,特征图将按通道进行拆分,然后分别通过级联组注意力的每个注意力模块.BiGMI模块在两分支间逐层引入空间和通道交互模块,以实现CNN和Transformer分支中特征的深度融合与高效利用.通过这种设计,可以逐层提取不同粒度的特征信息,以提高模型对图像的理解能力.接下来将详细说明DFE模块和BiGMI模块的具体实现细节,以进一步展示BiGMIViT在图像特征提取和融合方面的优势.
图1BiGMIViT概述
2.2深度特征
提取模块DFE模块的架构如图1(b)所示.它主要由DT模块、DV模块和卷积池化模块组成.DT模块由密集(Dense)模块和过渡(Transition)层组成,其中Dense模块实现功能如式(1)所示,其中i表示该层的索引.Ti(
分享:
临床上,机体腋路臂丛神经在腋窝腋动脉上方,腋动脉是人体在仰卧位上举胳膊时腋下下起伏的血管。腋路臂丛组织是一种常用的手或前臂麻醉方法,通过腋路腋动脉将麻醉剂注射到腋窝下,可以用在上肢下三分之一肘、前臂和手等处。本麻醉方法并发症少,对呼吸循环影响小。
2025-08-09主动脉夹层(AorticDissection,AD)是一种严重的心血管急症,其特征是主动脉壁内膜撕裂,导致血液在内膜和中层之间形成假腔。该疾病起病急骤、病情凶险,若不及时诊断和治疗,病死率极高。因此,早期准确的诊断和评估对于改善患者的临床预后至关重要。AD的临床表现多样且缺乏特异性,常表现为突发的剧烈胸背部疼痛,易与其他急腹症或心血管疾病相混淆,导致误诊和漏诊。
2025-08-06乳腺结节是乳腺疾病中的常见类型,主要因乳小叶及乳腺组织导管结构退行性病变所致,其中以乳腺增生、乳腺导管扩张、乳腺纤维瘤良性病变为主,但仍有少部分患者为恶性病变即乳腺癌。目前,临床上对于结节直径在1cm以内的良性病变常不做处理,但若为恶性病变则需尽快行根治性手术以改善预后,因此及时选择有效的检查方法确诊其良恶性尤为关键。
2025-07-23在全球范围内,肺部疾病已成为严重威胁人类健康的主要因素之一.在21世纪,因肺癌、新冠肺炎等肺部疾病而死亡的人不计其数.肺癌是全球癌症相关死亡的主要原因之一,而肺腺癌是其中最常见的亚型之一,占比约40%,对患者的生存率有着显著影响.另一方面,新冠肺炎作为一种全球性流行病,迅速蔓延,给全球卫生系统带来了巨大挑战,对肺部健康造成了严重威胁.
2025-06-19随着全球老龄化进程的加速,慢性肾脏病(CKD)的发病率逐年上升,终末期肾病(ESRD)患者数量显著增加,已成为一个重要的全球性健康问题。作为ESRD患者的主要替代治疗方式,维持性血液透析(MHD)的治疗效果和患者生活质量高度依赖于血管通路的功能状态。血管通路是血液透析的“生命线”,其通畅性和稳定性直接影响透析充分性和患者预后;
2025-05-28胰腺的囊性病变可以划分为两大类:一类是非肿瘤性囊肿,另一类则是囊性肿瘤,二者在临床表现、治疗方法以及预后上均存在显著差异[2]。其中,胰腺囊性肿瘤较为多见,大多数囊性病变为偶然发现,对胰腺囊性病变的准确、快速诊断对于患者后续的治疗至关重要[3]。
2025-05-27妊娠期是女性生理的特殊阶段,当妊娠期出现肺炎,不仅对孕妇的健康构成威胁,还可能对胎儿的生长发育产生不良影响。孕期肺炎的临床表现常不典型,易与妊娠期生理不适想混淆。中国成人社区获得性肺炎诊断与治疗指南指出,肺部影像学检查显示新出现的斑片状浸润影、叶或段实变影、磨玻璃影或间质性改变,伴或不伴胸腔积液是诊断肺炎的临床标准。
2025-04-23脑小血管病(cerebralsmallvesseldisease,CSVD)通常起病缓慢且临床表现隐匿,易被漏诊、误诊,其病理改变包括小动脉硬化、淀粉样变性、脂质透明样变性等,目前主要通过影像学特征确诊,腔隙性梗死灶、脑白质高信号为其最常见的影像学表现。研究发现,CSVD患病人群以老年人为主,不仅是继阿尔茨海默病后老年人群的第二大疾病,也是导致老年人认知功能障碍最常见的原因之一。
2025-04-11心肌桥是一种常见的先天性解剖学变异,走行于心肌桥 下 方 的 冠 状 动 脉 称 为 壁 冠 状 动 脉(muralcoronaryartery,MCA),一般无相应临床症状,但由于心肌的挤压使 MCA 的形态和功能受到影响,从而引起血流动力学发生改变,导致心律失常、心肌缺血、心 肌 梗 死 甚 至 猝 死 等 严 重 心 血 管 事 件 的 发生。
2025-02-17惠普尔养障体( TW) 是一种革兰阳性菌,呈杆状或丝状,但其革兰染色着色不良、抗酸染色呈阴性。它属于放线菌门放线菌纲放线菌目纤维素单胞菌科养障体属。它导致的感染至少有以下 3 种常见的表现形式①经典的 Whipple 病; ②局部慢性感染,如心内膜炎、脑炎等; ③急性感染,如肺炎、菌血症或胃肠炎等。
2025-01-22人气:5189
人气:5117
人气:4380
人气:3630
人气:3368
我要评论
期刊名称:计算机科学
期刊人气:2212
主管单位:重庆西南信息有限公司
主办单位:重庆西南信息有限公司
出版地方:重庆
专业分类:计算机
国际刊号:1002-137X
国内刊号:50-1075/TP
邮发代号:78-68
创刊时间:1974年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:0.000
影响因子:0.599
影响因子:0.335
影响因子:0.419
影响因子:0.422
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!