视频
载入播放器…
  • 提供配置文件
  • 我们的目标是在机器人的基本问题上进行突破性的研究,以使自主移动机械手能够执行这些和其他具有挑战性的任务。我们的重点不仅是令人兴奋的新研究,而且还将开发健壮的、广泛适用的新工具和软件,以便其他研究人员部署和使用。
产品组合
  • 项目

    • Make3D:单幅图像深度感知

    • 学习算法来预测深度和推断三维模型,只给一个单一的静态图像。应用包括从用户照片中创建沉浸式3d体验,提高立体视觉性能,用少量图像创建大尺寸模型,机器人导航等。成千上万的用户已经将他们的单张照片转换成3D模型。
    • 个人机器人:学习机器人操作

    • 学习预测机器人抓取的算法,即使是机器人从未见过的对象类型。适用于从洗碗机中取出物品、清理杂乱的桌子、打开新门等任务。
    • 整体场景理解:将模型作为黑箱组合

    • 整体场景理解需要同时解决多个任务,包括目标检测、场景分类、有意义区域的标记和三维重建。我们开发了一种学习方法,将这些单独的子任务结合起来,以提高每个子任务的性能。
    • 视觉导航:微型空中交通工具

    • 使用单眼深度感知和强化学习技术在非结构化环境中驾驶小型rc车高速行驶。也可以使用单个机载摄像头自主飞行室内直升机/四旋翼机。
    • 楼梯:打开新的门

    • 对于一个实际部署在家庭和办公室环境的机器人来说,他们应该能够操纵他们的环境,以获得进入新空间的机会。我们提出了这样做的学习算法,从而使我们的机器人成为第一个能够通过打开门和电梯在新建筑的任何地方导航的机器人,即使是它从未见过的门和电梯。
    • 楼梯:光学接近传感器

    • 我们提出了一种新的光学接近传感器,以提高抓握能力。这些传感器安装在指尖上,可以预触碰姿态估计,因此可以在线调整到初始抓点,而不需要过早接触物体或重新抓取策略。
    • Zunavision

    • 我们开发了一种算法,通过在视频中添加纹理来自动修改视频。我们的算法执行稳健的跟踪、遮挡推断和颜色校正,使纹理看起来是原始场景的一部分。
    • 视觉导航:高速避障

    • 使用单眼深度感知和强化学习技术在非结构化环境中驾驶小型rc车高速行驶。
    • Make3D扩展:来自稀疏视图的大比例模型

    • 创建大型环境的3d模型,只提供少量(可能)不重叠的图像。该技术集成了运动结构(SFM)技术和Make3D的单幅图像深度感知算法。
    • 利用单眼线索提高立体视觉

    • 立体视觉从根本上受到两个摄像机之间的基线距离的限制。即,当考虑的距离较大时,深度估计往往是不准确的。我们认为,单目视觉线索提供的深度信息在很大程度上是正交的,因此是互补的。我们提出了一种将单眼线索与立体(三角定位)线索相结合的方法,以获得比单独使用任何一种方法都更精确的深度估计。