视频
加载玩家...
  • 提供个人资料
  • TLD是一种屡获殊荣的实时算法,用于跟踪视频流中未知对象。感兴趣的对象由单个帧中的边界框定义。TLD同时跟踪对象,学习其外观并在视频中出现时检测到它。结果是实时跟踪,通常会随着时间的推移而改善。

    Zdenek Kalal在其博士学位论文中开发了TLD,由Krystian Mikolajczyk和Jiri Matas监督。TLD的主要贡献是在国际计算机视觉会议上提出的。由于他在TLD上的工作,Zdenek Kalal已获得2011年英国ICT先驱者的授予。
产品介绍
  • TLD-跟踪 - 学习 - 检测

  • 捕食者 - 从错误中学习的智能相机
    由于其学习能力,TLD已按名称做广告捕食者

    主要特征
    • tld跟踪当前只有一个对象
    • 输入:来自单眼相机的视频流,定义对象的边界框
    • 输出:流中的对象位置,对象检测器
    • 实现:MATLAB + C,单线,无GPU
    • 没有离线训练阶段
    • QVGA视频流的实时性能
    • 移植到Windows,Mac OS X和Linux
    目标
    我们的目标是对任意对象的长期实时跟踪。该对象由单个帧中感兴趣的区域定义。视频序列是不受限制的,对象可能会大大改变外观,部分或完全遮挡或移出视野。

    动机
    在许多计算机视觉应用程序中,任意对象的长期跟踪是一个核心问题:监视,对象自动对焦,大满贯,游戏,HCI,视频注释。

    挑战
    实时性能,部分和完整的阻塞,照明变化,大量位移,背景混乱,类似的对象,视频质量低。

    该方法
    长期跟踪任务分解为三个组成部分:跟踪,学习和检测(TLD)。这些组件中的每一个都涉及问题的不同方面,这些组件是并行运行的,并以协同方式组合以抑制其缺点。

    未来的工作
    记录代码并使其公开可用。自动初始化,测试不同的跟踪器和检测器,消除平面性假设,明确处理面外旋转,跟踪多个目标,学习形状。我们的目标是对任意对象的长期实时跟踪。该对象由单个帧中感兴趣的区域定义。视频序列是不受限制的,对象可能会大大改变外观,部分或完全遮挡或移出视野。
    • tld

    • 一个解决长期跟踪的框架。TLD从单个补丁及其扭曲初始化后训练对象的检测器。跟踪器和检测器并行运行,两者都有助于对象的估计位置。“不可见”是可能的输出。跟踪器和检测器的更新取决于下面描述的学习模块。
    • 追踪

    • 中间移位跟踪器 - 矩形的跟踪器,基于Lucas-Kanade跟踪器,强大到部分闭塞。估计翻译和规模。跟踪器验证 - 只要轨迹前进一致,检测器就会更新。
    • 学习

    • 通过P-N学习框架实现学习。对象由跟踪器跟踪。接近轨迹的贴片用正标(P-Consaints)更新检测器。该对象是由检测器检测到的,非穿M径的自信检测用负标签(n-constraints)更新检测器。这两个约束都会出现错误,学习稳定性是通过其相互补偿来实现的。
    • 检测

    • 第一阶段过滤器:
      随机森林,2bitbp特征

      第二阶段分类器:
      1-NN,10x10补丁,NCC
      置信度= D /(D + D)
      2位二进制功能
  • TLD的高级描述