(161005 齐齐哈尔工程学院信息工程系 黑龙江 齐齐哈尔)
【摘 要】视觉跟踪是计算机视觉中的一个挑战性问题。与视觉跟踪相反,对于物体识别和检测,当与亮度组合时复杂的颜色特征已经显示出提供优异的性能。由于跟踪问题的复杂性,理想的颜色特征应该是在计算中具有有效性,并且具有一定的光度不变性与较高的辨别力。本文研究了颜色特征在跟踪框架中的作用。
1.彩色视觉跟踪
本文方法基于CSK跟踪器,在最近的评估中,CSK跟踪器显示了十大跟踪器中最快的速度。CSK跟踪器从单个图像补丁中学习目标的核化最小二乘分类器。其出色速度的关键在于CSK跟踪器利用了从局部图像补丁的周期性假设中出现的循环结构。在常规的CSK跟踪器中,通过将灰度图像块与Hann窗口相乘来对其进行预处理。我们对每个功能通道应用相同的步骤。通过堆叠亮度和颜色通道获得最终表示。
颜色特征的选择对于视觉跟踪器的整体成功至关重要。
最近,颜色属性在对象识别,对象检测和动作识别中获得了出色的结果。在这里,我们调查他们的视觉跟踪问题。颜色属性或颜色名称(CN)是人类分配的代表世界上颜色的语言颜色标签。
传统的CSK跟踪器将灰度值归一化为[-0.5,0.5]。这抵消了由于加窗操作导致的失真,该失真影响了内核中的L2距离。我们研究了两种不同的颜色名称规范化技术。在第一种情况下,将颜色名称居中,只需从每个颜色仓中减去1/11。
这会将颜色名称投影到10维子空间,因为颜色仓总和为零。
在第二种情况下,通过将颜色名称投影到此10维子空间的正交基础上来执行归一化。该投影使颜色名称居中,同时将维数从11减小到10。作者发现正交基的选择对于CSK跟踪器不重要,有另一种技术可以使跟踪器获得更好的性能,因此可以使用它来标准化颜色名称。
1.1 强化颜色特征分类器
为了实现对外观变化具有鲁棒性的视觉跟踪,有必要随时间更新目标模型。在CSK跟踪器中,模型由学习到的目标外观 x和变换后的分类系数A组成。这些仅通过考虑当前外观来计算。然后,跟踪器采用一种即席方法,通过简单的线性插值法更新分类器系数:Ap =(1-γ)Ap-1 +γA,其中p是当前帧的索引,γ是学习速率参数。这导致性能欠佳,因为并非所有先前的帧都同时用于更新当前模型。与CSK方法相反,MOSSE跟踪器通过在计算当前模型时直接考虑所有先前帧来采用可靠的更新方案。但是,该方案仅适用于线性核和一维特征。在这里,将更新方案概括为核分类器和多维颜色特征 。
为了更新分类器,我们考虑所有提取的外观{xj:j =1,…… ,p}从第一帧到当前帧p的目标。 代价函数构造为这些帧上的加权平均二次误差。为了保持训练和检测任务的简单性,解决方案被限制为仅包含一组分类器系数a。每个帧j的权重都为常数βj≥0。
1.2低维自适应颜色属性
CSK跟踪器的计算时间与特征尺寸成线性比例。这是诸如颜色属性之类的高维颜色特征的问题。我们建议使用一种自适应降维技术,该技术可在保留有用信息的同时大幅减少颜色尺寸的数量,从而显着提高速度。
通过最小化代价函数,为当前帧p找到合适的降维映射。为了获得对投影矩阵的鲁棒学习,我们添加了平滑度项。设Bj是为较早帧(j <p)计算的投影矩阵。如果新投影矩阵Bp和较早投影矩阵Bj中的列向量不跨越同一特征,则平滑度项只会增加代价子空间。这是由于内部乘积和RBF核在单一操作下是不变的这一事实引起的。
2.实验
首先,对色彩特征进行全面评估以进行视觉跟踪。其次,评估颜色特征学习方案。最后,与其他跟踪算法进行定性比较。
2.1 颜色特征
除了评估基于颜色属性的跟踪外,我们还会对其他颜色表示形式进行广泛的评估。这些颜色特征的动机从光度不变性和判别力到受生物学启发的颜色表示形式不等。
RGB:作为基准算法,使用标准的3通道RGB颜色空间。
LAB:LAB色彩空间在感知上是统一的,这意味着相等距离的颜色在感知上也被认为是等距的。YCbCr:YCbCr在感觉上近似均匀,通常用于图像压缩算法。rg:rg颜色通道是考虑的许多光度不变颜色表示中的第一个,它们在阴影和阴影效果方面是不变的。HSV:在HSV颜色空间中,H和S对于阴影着色是不变的,此外H对于镜面反射也是不变的。
2.2与其他算法的对比
将提出的方法与所选跟踪器进行比较的结果如图1所示。在两个评估中,本文提出的CN跟踪器获得了最好的结果。
图1.算法对比的TER与SRE精度图
3.总结
本文使用颜色属性进行跟踪,将CSK跟踪器的学习方案扩展到多通道颜色功能。此外,提出了颜色属性的低维自适应扩展。现有的几种跟踪器以显着较低的帧速率为代价提供了有希望的准确性。但是,速度是许多现实应用(例如机器人技术和实时监控)的关键因素。尽管在早期的目标跟踪文献中经常使用颜色特征,但其主要应用简单的颜色转换。本文演示了选择颜色转换的重要性。
参考文献:
[1]付灿. 基于目标特征匹配的视觉跟踪算法研究[D].新疆大学,2019.