焦传扬, 丁学明
控制工程. 2024, 31(5): 912-919.
行人重识别(Re-identification, ReID)的关键挑战之一是提取关键且鲁棒的特征,近年来,Transformer 网络不断展现其在该问题上具有强大的特征提取和表达能力。针对传统 Transformer 网络局部信息获取不如卷积神经网络的问题,提出一个基于ReID 的全局滤波池化多关系 Transformer(Trans-global filter pooling multi relationship-ReID, TFMR)网络新型框架,解决了 Transformer 网络局部关系建模不够丰富的问题。多关系(multirelation, MR)
网络考虑身体多个部位间的关系,使特征包含局部信息之间的联系,增强特征中行人生理结构的关联。同时设计了全局滤波池化(global filter pooling, GFP)模块,将其嵌入到 Transformer 网络中,降低图片中噪点的干扰并减少视图变化造成的特征偏差,从而获取人物图像中更清晰的全局特征,提升识别准确率。实验表明,模型在区分行人信息问题上具有高效性,在 Market-1501、DukeMTMC-ReID 和 MSMT17 数据集中优于其他模型。