8月2日至4日,实验室王嘉毅和王梓懿同学参加了在云南昆明举办的2023中国多媒体大会(chinamm2023),并展示了论文《基于小波变换和平行注意力机制的多源遥感图像分类方法》 、《基于旋转目标感知网络的sar船舶检测方法》和《基于transformer和通道混合并行卷积的高光谱图像去噪方法》。
基于小波变换和平行注意力机制的多源遥感图像分类方法由王嘉毅和张天戈合作完成,该方法构建了基于小波变换的特征提取器,能够充分利用频域分析技术,在可逆下采样的过程中充分捕捉粗/细粒度级别特征;同时,提出了基于平行注意力机制的特征融合器,充分综合多模态遥感数据的一致性和差异性,完成强相关性特征的融合和生成,可以显著提升多源遥感图像分类的准确率。
基于旋转目标感知网络的sar船舶检测方法由王梓懿、尹嘉豪、黄博斌合作完成。为了解决目标尺寸变化多样的问题,该方法主干网络使用基于多尺度 transformer 架构的 pvtv2,可以更好地保留特征图的局部连续性,同时更好地融合图像的多尺度特征。同时,为了解决目标有多种方向且训练样本数量有限的问题,将旋转边界框与 retinanet 结合,有效减少了背景冗余以及噪声的干扰。
基于transformer和通道混合并行卷积的高光谱图像去噪方法由胡帅、龚卓然、上官心语合作完成,模型包括三个关键模块:通道混合特征提取模块、基于块下采样的全局增强模块和自适应双向特征融合模块。通过这三个模块的相互作用,可以充分结合全局和局部的特征信息,处理不同区域中的噪声和纹理差异,有效提高模型对空间细节信息的恢复能力。
目前,这三个工作分别被推荐到《中国图象图形学报》和《北京航空航天大学学报》发表。
2023中国多媒体大会由中国计算机学会(ccf)、中国图像图形学学会(csig)主办,ccf多媒体技术专业委员会、csig多媒体专业委员会、云南大学承办,昆明理工大学、云南师范大学和云南民族大学联合承办,参会人数超过1000人,通过面对面交流,共同促进多媒体领域的蓬勃发展。