您的位置：首页 > 移动开发 > Objective-C

A Twofold Siamese Network for Real-Time Object Tracking【参考性不强】

2019-03-28 16:04 1316 查看

摘要
观察到在图像分类任务中学习的语义特征和在相似性匹配任务中学习的外观特征互补，作者构建了两个孪生网络框架，称为SA-Siam，用于实时的目标跟踪。SA-Siam由语义分支和外观分支组成，每一个分支都是一个相似性学习孪生网络。作者分别训练了这两个分支来保持两种类型特征的异质性，也就是让两种特征不一样。此外，作者在语义分支上加入了通道注意力机制，这个东东是干啥的，它可以根据目标位置周围的信息激活来计算通道权重，不同的跟踪目标有不同的通道权重。同时SiamFC的固有结构可以让跟踪器保持实时性，两个孪生网络和注意力机制的设计可以大大的提高跟踪性能。通过在OTB2013/50/100基准上测试，作者提出的的SA-Siam算法性能优于其它的实时跟踪器。

框架
本文的关键是设计一个高性能的跟踪器，即拥有判别特征，又可以鲁棒性强，但一般的设计思路是强有力的深度特征和在线训练，本文舍弃了这个做法，采用两个孪生网络分别训练出不同的特征，一个是语义网络，采用图像分类任务中的深层特征包含很强的语义信息，一个是外观网络，采用相似性学习问题中的外观特征，它俩可以做到互补。

语义网络
这篇文章的重点便是此，上图橙色的表示语义网络。
注意几点：
参数用的是在分类任务中预训练好的AlexNet参数，这点很重要！在训练和测试时固定所有参数，它不训练。
提取最后两层conv4和conv5的特征，用1x1卷积核融合这些特征，并改变通道数使通道总数和外观网络的通道数一样。这些特征来产生通道权重。
目标模板变为zs z^sz
s
，zs z^sz
s
和X一样大，和z zz有一样的中心，但包含了上下文信息，因为支路上加了通道注意力模型，通过目标和周围的信息来决定权重，选择对特定跟踪目标影响更大的通道。
另外，要对最后两层conv4和conv5出来的feature map在做一个简单的裁剪操作，再乘上权重。这样做的目的是为了和z zz大小的输出尺寸一样大，好做最后的响应图融合。
语义分支网络训练时只训练通道注意力模块和融合模块。

通道注意力模型
为什么加入这个模型呢？作者这么说：高层语义特征对目标外观的变化具有鲁棒性，因此使得跟踪器判别力不强，为了提升语义分支的判别力，加入了通道注意力模型。因为不同的通道对不同的跟踪目标的重要性不一样，通过这个模型给来赋予这些影响大的通道更高的权值。另外，既然要寻找更有判别力的通道，目标周围的信息也很重要。

最后，作者讨论了本文的三个重点细节：

1. 他们将两个网络分开训练而不是联合训练，这样保证两个网络的异质性
2. S-Net中AlexNet部分的参数没有微调，直接用的是预训练好的分类任务中的参数
3. A-Net保持和SiamFC一样，这样可以保证网络之前优异的泛化能力

---------------------
作者：小沛哥
来源：CSDN
原文：https://blog.csdn.net/fzp95/article/details/81028039
版权声明：本文为博主原创文章，转载请附上博文链接！

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航