Siamese方法通过提取当前帧的模板特征来定位下一帧的目标位置的方法来解决目标跟踪问题。一般来说,模板是前面图像帧的线性组合,导致随着时间的增加模板信息会有一个指数衰减。虽然这种更新方法已经提升了结果,但是它的简单性限制了通过学习更新可能获得的潜在效果。作者提出了用学习更新模板的方式来替代手工更新模板的方式。作者提出了一种叫UpdateNet的卷积神经网络方式,用之前积累的模板和当前帧的模板来生成一个下一帧可以用的最优模板。UpdateNet可以很容易地融合到现有的Siamese网络中。
Standard update
最近的跟踪方法无论是相关滤波的方法还是基于Siamese网络的方法都是用指数加权平均来更新模板,如下面公式所示:
这种方法虽然可以集成新的信息,但是它有严重缺点。
Learning to update
文章用新的学习更新策略来代替传统的更新策略,更新模板的公式如下所示:
函数参数包括初始帧模板,上一帧模板和上次计算出的模板,目的就是通过学习这样一个函数来实现更新模板的功能,整体的示意图如下图所示:
Tracking framework with UpdateNet
向上面的图所呈现的那样,通过训练得到UpdateNet的参数,将始帧模板,上一帧模板和上次计算出的模板输入到这个网络中得到新的模板,然后用新的模板进行相似性计算,得到分数图。
Training UpdateNet
在训练过程中损失函数被写成如下的形式:
Experiments
Conclusions
作者整体的思路比较清晰,仔细分析了之前模板更新方法的问题,想了一个新的模板更新策略,比之前策略的效果要好。