视频
加载播放器…
  • 提供配置文件
  • TLD是一个屡获殊荣的实时算法,用于跟踪视频流中的未知对象。感兴趣的对象由单个帧中的边界框定义。TLD同时跟踪对象,学习其外观,并在视频中出现时检测它。结果是实时跟踪,通常会随着时间的推移而改进。

    TLD由Zdenek Kalal在他的博士论文中开发,由kristian Mikolajczyk和Jiri Matas指导。TLD的主要贡献已经在国际计算机视觉会议上得到了展示。由于他在TLD方面的工作,Zdenek Kalal被授予2011年英国ICT先锋奖。
产品组合
  • TLD -跟踪-学习-检测

  • 掠夺者-智能相机,从错误中学习
    由于其学习能力,TLD已经在名义下做广告捕食者

    关键特性
    • TLD目前只跟踪一个对象
    • 输入:来自单目摄像机的视频流,定义对象的包围框
    • 输出:对象在流中的位置,对象检测器
    • 实现:Matlab + C,单线程,无GPU
    • 无线下培训阶段
    • QVGA视频流的实时性能
    • 移植到Windows, Mac OS X和Linux
    目标
    我们的目标是长期实时跟踪任意物体。对象由单个帧中感兴趣的区域定义。视频序列是不受约束的,物体可能会显著改变外观,部分或完全遮挡,或在视野中移动或移出。

    动机
    任意目标的长期跟踪是许多计算机视觉应用的核心问题:监控、目标自动对焦、SLAM、游戏、HCI、视频注释。

    挑战
    实时性能,部分和全部遮挡,照明变化,大位移,背景杂波,相似物体,视频质量低。

    的方法
    将长期跟踪任务分解为三个部分:跟踪、学习和检测(TLD)。这些组件中的每一个都处理问题的不同方面,这些组件并行运行,并以协同的方式组合起来以抑制它们的缺点。

    未来的工作
    记录代码并使其公开可用。自动初始化,测试不同的跟踪器和检测器,消除平面性假设,显式处理平面外旋转,跟踪多个目标,学习形状。我们的目标是长期实时跟踪任意物体。对象由单个帧中感兴趣的区域定义。视频序列是不受约束的,物体可能会显著改变外观,部分或完全遮挡,或在视野中移动或移出。
    • TLD

    • 解决长期跟踪问题的框架。TLD训练一个对象的探测器,在初始化一个单一的补丁和它的扭曲。跟踪器和探测器是并行运行的,两者都有助于估计物体的位置。“Not visible”是可能的输出。跟踪器和检测器的更新取决于下面描述的学习模块。
    • 跟踪

    • 中移跟踪器-基于Lucas-Kanade跟踪器的矩形跟踪器,对部分遮挡具有鲁棒性。估计翻译和规模。跟踪器验证——只要轨迹前后一致,探测器就会更新。
    • 学习

    • 学习是在P-N学习框架内实现的。对象由跟踪器跟踪。靠近轨迹的补丁用正标签(p约束)更新探测器。对象被检测器检测到,非最大置信检测用负标签(n-约束)更新检测器。两种约束都存在误差,通过相互补偿来实现学习的稳定性。
    • 检测

    • 一级过滤器:
      随机森林,2bitBP特征

      第二级分级机:
      1-NN, 10x10补丁,NCC
      信心= d / (d + d)
      2位二进制特征
  • TLD的高级描述