- 提供个人资料
- TLD是一种屡获殊荣的实时算法,用于跟踪视频流中未知对象。感兴趣的对象由单个帧中的边界框定义。TLD同时跟踪对象,学习其外观并在视频中出现时检测到它。结果是实时跟踪,通常会随着时间的推移而改善。
Zdenek Kalal在其博士学位论文中开发了TLD,由Krystian Mikolajczyk和Jiri Matas监督。TLD的主要贡献是在国际计算机视觉会议上提出的。由于他在TLD上的工作,Zdenek Kalal已获得2011年英国ICT先驱者的授予。
产品介绍
TLD-跟踪 - 学习 - 检测
- 捕食者 - 从错误中学习的智能相机
由于其学习能力,TLD已按名称做广告捕食者。
主要特征
- tld跟踪当前只有一个对象
- 输入:来自单眼相机的视频流,定义对象的边界框
- 输出:流中的对象位置,对象检测器
- 实现:MATLAB + C,单线,无GPU
- 没有离线训练阶段
- QVGA视频流的实时性能
- 移植到Windows,Mac OS X和Linux
目标
我们的目标是对任意对象的长期实时跟踪。该对象由单个帧中感兴趣的区域定义。视频序列是不受限制的,对象可能会大大改变外观,部分或完全遮挡或移出视野。
动机
在许多计算机视觉应用程序中,任意对象的长期跟踪是一个核心问题:监视,对象自动对焦,大满贯,游戏,HCI,视频注释。
挑战
实时性能,部分和完整的阻塞,照明变化,大量位移,背景混乱,类似的对象,视频质量低。
该方法
长期跟踪任务分解为三个组成部分:跟踪,学习和检测(TLD)。这些组件中的每一个都涉及问题的不同方面,这些组件是并行运行的,并以协同方式组合以抑制其缺点。
未来的工作
记录代码并使其公开可用。自动初始化,测试不同的跟踪器和检测器,消除平面性假设,明确处理面外旋转,跟踪多个目标,学习形状。我们的目标是对任意对象的长期实时跟踪。该对象由单个帧中感兴趣的区域定义。视频序列是不受限制的,对象可能会大大改变外观,部分或完全遮挡或移出视野。
-
-
tld
- 一个解决长期跟踪的框架。TLD从单个补丁及其扭曲初始化后训练对象的检测器。跟踪器和检测器并行运行,两者都有助于对象的估计位置。“不可见”是可能的输出。跟踪器和检测器的更新取决于下面描述的学习模块。
-
追踪
- 中间移位跟踪器 - 矩形的跟踪器,基于Lucas-Kanade跟踪器,强大到部分闭塞。估计翻译和规模。跟踪器验证 - 只要轨迹前进一致,检测器就会更新。
-
学习
- 通过P-N学习框架实现学习。对象由跟踪器跟踪。接近轨迹的贴片用正标(P-Consaints)更新检测器。该对象是由检测器检测到的,非穿M径的自信检测用负标签(n-constraints)更新检测器。这两个约束都会出现错误,学习稳定性是通过其相互补偿来实现的。
-
检测
- 第一阶段过滤器:
随机森林,2bitbp特征
第二阶段分类器:
1-NN,10x10补丁,NCC
置信度= D /(D + D)
2位二进制功能
-
-
-
-
-
-