导航:EXPO21XX>机器人21 xx>H22:移动机器人研究> Sapienza Università di Roma
Sapienza Università di Roma
视频
载入播放器…
  • 提供配置文件
  • ALCOR成立于1998年。研究活动主要集中在认知机器人系统应该能够激活的感知推理过程上。

    我们研究和发展与知觉过程相关的表征方法和推理方法。从早期注意开始,我们研究了由运动、动作和互动引起的视听突出的许多方面。我们还对显著性概念的这些不同方面的分类如何导致对人类行为不同模式的识别感兴趣,并总体上对环境中事件如何展开的识别感兴趣。
产品组合
  • 实验室

  • 我们的目的是强调识别过程是一个有效的推理过程,它可以告知和确定关于环境的知识的形成,关于事件是如何确定和诱导的,以及关于它们的时空关系的知识。我们通过识别过程、三维重建、人物面部表情解读、动作解读、形状分析、视听场景中的自下而上注意、用于视觉定位的自然图像、行为预测的概率和逻辑模型等不同方面进行研究。我们的大多数实验都使用Gaze机器,这是一种正在逐步开发中的设备。
  • 视觉和知觉

  • 人类行为识别

  • 识别人的动作是用户友好、高级人机交互的先决条件。此外,它还提供了通过演示来训练自主系统的方法,以便开发执行一个行动所必需的技能。

    为了感知人类的动作,我们使用了从全方位摄像头到Kinect等深度传感器的传感器,以便构建和利用基于模型的人类表征,同时识别动作环境。在人体动作识别过程中,我们的研究方向是基于水平集方法的非刚性形状分析和重建以及姿态不变形状匹配。
  • X-SAR图像分类

  • 在过去的几十年里,SAR图像已经成为遥感工业最有前途的产品之一。在卫星平台上,由于天线的移动、信号的频率(微波域)和源目标之间的距离,可以获得小于1米的空间分辨率。这些图像是通过使用SAR传感器获得的,它可以探测物体表面的反向散射辐射。目前,两个最重要的卫星任务配备了SAR传感器,一个是意大利(ASI)的小卫星星座,名为cosmoo - skymed,另一个是德国航空航天中心(DLR)的卫星TerraSAR-X。所有这些卫星都在太阳同步轨道上,距离地球表面约600公里,使用X波段(8-12 GHz)的信号。采集模式可以从:大区域ScanSAR到聚光灯图像。微波域保证了高穿透云层和大气的能力,由于SAR是一个主动系统,获取的图像不依赖于光照条件。生成的图像是类似灰度的图像,对各种目的都非常有帮助,例如:环境监测、海岸线监视、边界控制和其他与环境与安全地面监测(GMES)相关的主题。

    我们的研究涉及数千张非常高分辨率的地球图像(COSMO-SkyMed X-SAR SpotLight图像),这些图像每天都提供给所有与安全和风险预防相关的潜在应用。尽管它们的方位角分辨率很高,但是这些图像对人眼来说是很难解读的,特别是当需要精确理解一个小尺度区域时,如城市社区,自然和人造物体的几个细节出现在场景中。因此,解释问题是建立场景中每个物体及其后向散射信号之间的关系模型,用图像强度值表示,并见证物体或其部分反射特定波长的亮度。
    在这一领域,我们的研究兴趣是基于定义一个模型来识别图像中出现的物体之间的关系和每个物体的后向散射特性,以便获得这些图像的自动解释。我们的方法的优点在于使用非常高分辨率的图像,一个像素代表不到1平方米。
    散斑噪声的存在会降低所产生的图像,特别是在那些辐射信号的不同部分在传播过程中相互作用更频繁的地区(人口稠密地区)。

    由于Alcor实验室在计算机视觉、机器学习和模式识别领域有丰富的经验,在第一阶段,我们想要定义一组特征,可以最好地表征不同的土壤和土地覆盖。因此,我们的工作主要集中在城市公园的X-SAR SpotLight图像上,因为它们可以有各种各样的土地覆盖,由于信号反射不同,散斑噪声通常比其他地区低。
    计算机视觉社区已经开发了许多算法来增强边缘、角落、不同的纹理,或再现人类视觉系统,或压缩图像。但是这些特征提取器如何用于X-SAR图像的分析和解释呢?
    到目前为止,我们的努力表明,一些特征,例如纹理特征,可以最好地模拟水,基于纹理的分割可以用于分割水,并取得了良好的效果,对于非常高分辨率的SpotLight X-SAR图像也是如此。然而,从另一个角度我们看到,当分辨率变得如此之高时,必须设计X-SAR调谐特征描述符来获得良好的分类。
  • 规划与认知机器人

  • 任务切换

  • 在现实世界中,机器人必须执行多个活动,需要适当设计的认知控制来选择和协调多个任务的操作。
    认知控制,在神经科学研究中,是在执行给定任务所需的输入、内部状态和输出之间建立适当映射的能力。它经常借助于抑制的概念进行分析,解释一个主体如何在多种刺激面前有选择地作出反应,并能够抵制不适当的冲动。认知控制作为一种通用功能,解释了在需要重新配置记忆和感知时,通过脱离以前的目标或任务集,在任务之间灵活切换。
    自80年代以来,对认知控制和主要是对人类适应行为的研究,在任务切换范式内进行了调查,强烈影响了认知机器人架构。基于模型的执行机器人控制方法,通过黑客行为的实时选择、执行和动作指导,使运行时系统管理向后抑制。这种基于模型的观点假设了执行人员的声明式(符号)模型的存在,认知控制可以使用该模型在反应式控制循环中的流程之间切换。
    在这种背景下,规划界提出的灵活的时间规划方法在现实世界的应用中显示出了强大的实际影响,该方法基于考虑和执行的整合。这些方法结合了计划、调度和资源优化,用于管理许多机器人任务中涉及的所有竞争性活动。灵活的时间规划方法支持时间约束网络,为不同事件和过程之间的行为交互和时间切换提供了良好的模型。
    另一方面,从一个不同的角度来看,定性认知机器人1社区在行动和变化理论的领域内引入了高级执行控制,如情境演算、流畅演算、事件演算、行动语言及其内置的代理编程语言,如Golog家族。在行动和变化框架理论中,执行控制问题主要是根据行动的性质、它们对世界的影响(如框架问题)和主体根据其欲望、意图和知识决定成功行动顺序的能力来考虑的。
    尽管如此,反应性行为已经从试剂作用和由自然诱导的外部外生作用的交错性质的角度来考虑。
    现实世界的机器人应用越来越关注的不仅是(而且不仅仅是)动作的特性,还有系统对大量刺激的反应,这需要处理响应时间。因此,在任务切换(视觉、定位、操作、探索等)中,需要协商反应的多样性,这为行动理论提供了不同的视角。
    一个例子是对代理编程语言或多种交互形式的日益强调,导致了多代理系统的异常爆发。事实上,对来自环境的许多信息源的控制,以及对感知运动和选择过程的资源分配的仲裁,已经成为行动和行为建模的核心挑战。
    我们认为,从适应性、灵活性和切换性行为的角度来看,执行控制的复杂性要求设计一个有根据的和解释性的框架,只有在行动、感知和互动的连贯和强有力的定性模型中才能完成。
    我们希望扩展情境演算的框架,容纳Allen时间间隔、多条时间线和并发情境,以表示异质、并发和交错的灵活行为,服从切换时间标准。这导致了一个新的集成范式,其中多个并行时间线同化了活动之间的时间约束。
  • 多通道HRI

  • 作为设计能够参与对话的机器人的一步,我们正在开发一个对话场景的模型,在这个模型中,音频和视觉线索相结合,以执行多模态说话者识别。
    • 机器人会主动跟随对话

    • 它专注于当前的说话者

    • 多人脸检测与跟踪

  • 机器和设备

    • 目光机

    • GAZE MACHINE是一种可穿戴设备,可以识别佩戴者在环境中的注视扫描路径。它可以很容易地穿着,所以穿着它的受试者可以在任何光线条件下走动,无论是室内还是室外。
    • VICON MX

    • Vicon MX系统是最先进的光学运动捕捉系统。Vicon MX系统的主要组成部分是摄像机、控制硬件模块、分析和显示数据的软件和运行软件的主机。每一个Vicon MX系统包括至少一个MX Giganet,为多达10个摄像头和其他设备提供电力和数据通信。
    • 塔洛斯

    • TALOS是一种履带式移动机器人,两侧有两个履带式转向架,前后各有四个主动履带式鳍状肢,这使它在崎岖地形中具有更强的机动性。它配备有主动和被动传感器,即旋转2D SICK LMS-100激光器、Ladybug3全向相机、Xsense惯性测量单元(IMU)、GPS和机载四核计算机。
    • SECURO代理(虾)

    • Bluebotics ShrimpIII机械架构为机器人提供了难以置信的机动性。它可以在极具挑战性的地形上轻松移动,克服两倍于车轮大小的垂直障碍,甚至可以爬楼梯。额外的有效载荷由一台轻型笔记本电脑、定位传感器(惯性平台Crossbow)和图像采集传感器(两台火线摄像机PtGrey跳蚤)、一组锂离子电池、通信(蓝牙和无线802.11a)组成。所有额外的载荷都安装在由碳纤维和有机玻璃制成的特殊结构上。
    • DORO Agent2 (Pioneer P3-AT)

    • DORO Agent1(先锋3DX)

    • ActivMedia PIONEER 3-DX是一款灵活、多功能的智能移动机器人平台,能够稳健地承载负载并穿越基梁,具有高性能管理功能,可在需要时提供动力。它被授予:一个带有几个由联合威森技术马林提供的立体相机的移动头,一个用于定位的Xsens MT9惯性平台,8个声纳环宝丽来。其他部件有:笔记本电脑华硕M3000N (centrino),激光DISTO徕卡,奥迪赛电池和相应的电源和支撑结构。笔记本电脑上安装的软件组件有:ActiveMedia提供的API ARIA和sapira, Matlab(包括图像采集、图像处理、神经网络、符号数学、统计、优化、小波、信号处理工具箱),编译器c++, prolog ECLIPSE框架,prolog解释器,Java。该机器人的价值包括专门开发的定位、地图重建、通信和规划、导航和识别软件。
  • 计算机图形学

    • 计算机图形学

    • 计算机动画,基于物理的模拟,GPGPU,虚拟人物动画

      我们的研究领域是基于物理的仿真和虚拟人物动画合成,重点是在娱乐和医疗领域的应用。特别是研究的重点

      • 计算物理模型在软体仿真中的应用
      • 适合现代gpu充分利用的并行仿真算法和数据结构的设计和实现。
      我们结合了强大的算法和计算机科学背景与经验和愿望工作的应用问题涉及计算动画。

    • 三维虚拟人脸动画的计算模型

    • 人脸运动的模拟是一项艰巨的任务,因为复杂而复杂的人类头部结构涉及到黏弹性、非线性、各向异性和结构异质的生物组织之间的运动、变形和接触处理。这使得建立一个能够代表面部生物力学内部运作的数学模型变得困难。尽管如此,我们还是需要很高的准确性和精确度,因为作为人类,我们从出生的那一刻就习惯了观察和解码面部表情,我们擅长于轻松地检测虚拟面部动画中最小的人工制品。

      我们开发了一种基于物理的综合方法,通过再现人类头部的肌肉骨骼结构以及骨结构、面部肌肉和皮肤之间的相互作用来模拟面部运动。实验证明,该模型能够在消费类平台上对不同的输入人脸模型实时有效地合成真实的表情人脸动画。

    • 基于gpu的软体动画

    • 消费图形适配器已经从通用适用性非常有限的小部件发展到使用非常灵活的高功率计算设备。在过去的几年中,它们的计算能力和内存带宽得到了极大的提高。提供高级语言支持,最近的图形硬件能够在广泛的应用程序中胜过CPU集群。我们完全依靠gpu的并行计算能力,开发了一个用c++/CUDA编写的物理引擎。然而,与以串行方式迭代求解物理约束不同,在预初始化阶段,引擎会创建几个不同的约束集群,这些约束集群可以通过红黑高斯- siedel求解器并行求解。通过这种方式,所获得的性能比串行方法快了两个数量级,我们计划将这种引擎应用于不同的环境,特别是外科模拟器和自动虚拟角色动画。我们还研究了划分约束集的不同算法策略,以便在显卡上可用的多处理器之间实现可调的工作负载平衡
    • Multiple-legged机器人仿真

    • 机器人仿真在开发机器人应用程序中非常重要,无论是对应用程序、行为、场景的快速原型,还是对许多高级任务的调试目的。机器人模拟器一直用于开发复杂的应用程序,而模拟器的选择取决于我们感兴趣的特定任务。此外,模拟器对机器人教育也非常重要:事实上,它们是强大的教学工具,允许学生在家里开发和实验典型的机器人任务,而不需要他们使用真正的机器人。