近日,我校计算机学院2021级硕士生龙伟在地球科学和遥感领域顶级期刊《IEEE Transactions on Geoscience and Remote Sensing(IF=8.2,中科院一区TOP期刊)》发表了题为“Threshold Attention Network for Semantic Segmentation of Remote Sensing Images”的学术论文,论文通讯作者为该院张永军老师。IEEE TGRS是地球科学和遥感领域的世界级顶级期刊,是IEEE地球科学与遥感技术协会(GRSS)会刊,在遥感技术和地球科学领域具有很高影响力。
遥感是获取地理空间信息的一个重要来源,在许多应用领域中发挥着重要作用,包括城市规划、植被监测、军事监视、灾害监测和气象监测等。语义分割式遥感的基本任务之一,需要为遥感图像中的每一个像素都分配一个唯一的类别标签。语义分割领域常用的自注意力机制(Self-attention mechanism, SA)虽然可以捕捉到长距离像素依赖关系,使网络能够建模输入特征之间的全局依赖关系。但是,自注意力机制中使用的高密度注意力特征图会导致计算复杂度很大。此外,此方法还会引入对特征表示有负面影响的冗余信息导致分割效果不佳。自注意力机制中考虑的是图像中单个像素之间的依赖关系。然而,人类在对图像进行分割时,通常会将图像划分成许多个像素类似的区域,然后再去关注这些区域块之间的关系。受此启发,我们设计了一种全新的可以获取不同特征区域块间的依赖关系的阈值注意力。
该文提出了一种新颖的阈值注意力机制(Threshold Attention Mechanism, TAM)。这种注意力机制在减小自注意力计算量和遥感分割领域的区域特征建模取得了重要突破。阈值注意力机制不仅能更好地获取遥感图像特征图不同区域之间的关联性,还能显著地减少了计算量,突破了原有注意力机制计算量巨大的缺陷。
阈值注意力网络总体结构图
阈值注意力模块图
基于TAM方法,本文设计了一种全新的语义分割网络—阈值注意力网络(Threshold Attention Network, TANet),并且在遥感领域常用的公开数据集ISPRS Vaihingen和Potsdam上进行了大量的实验。和最先进的语义分割方法相比,本文所提出的TANet在多个指标上都取得了当前最优的结果。
论文链接: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10124446