萨皮恩扎Università罗马
视频
加载播放器…
  • 提供配置文件
  • ALCOR成立于1998年。研究活动主要集中在认知机器人系统应该能够激活的感知推理过程。

    我们研究和发展与知觉过程相关的表征方法和推理方法。从早期注意开始,我们研究视听突出的许多方面,如由运动,动作,互动引起的。我们还感兴趣的是,如何对显著性概念的这些不同方面进行分类,从而导致对人类行为的不同模式的认识,以及总体上对事件在环境中如何展开的认识。
产品组合
  • 实验室

  • 我们的目标是强调识别过程是一个有效的推理过程,可以告知和确定关于环境的知识的形成,关于事件是如何确定和诱导的,以及关于它们的时空关系。我们通过识别过程、3D重建、人物面部表情解释、运动解释、形状分析、视听场景中的自下而上注意力、用于视觉定位的自然图像、动作预测的概率和逻辑模型等不同方面来研究这一点。我们的大多数实验都使用Gaze机器,这是一种正在逐步发展的设备。
  • 视觉与知觉

  • 人类行为识别

  • 识别人类行为是用户友好的、高水平的人机交互的前提。此外,它还提供了通过演示来训练自主系统的手段,以发展执行行动所必需的技能。

    为了感知人类的动作,我们使用了从全向摄像头到深度传感器(如Kinect)的传感器,以构建和利用基于模型的人类表示,同时识别动作上下文。在人体动作识别过程中,我们的研究方向是基于水平集方法的非刚性形状分析与重建以及位姿不变形状匹配。
  • X-SAR图像分类

  • 在过去的几十年里,SAR图像已经成为遥感行业最有前途的产品之一。在卫星平台上,由于天线的运动、信号的频率(微波域)以及源目标之间的距离,可以获得小于1米的空间分辨率。这些图像是通过使用SAR传感器获得的,该传感器检测到来自物体表面的后向散射辐射。目前装备SAR传感器的两个最重要的卫星任务是意大利(ASI)命名为cosmos - skymed的小卫星星座,以及德国航空航天中心(DLR)的TerraSAR-X卫星。所有这些卫星都在太阳同步轨道上,在地球表面上方约600公里处,使用X波段(8-12 GHz)的信号。采集模式可以从:大区域扫描ar到聚光灯图像。微波域保证了高穿透云层和大气,由于SAR是一个活动系统,所获得的图像不依赖于照明条件。所得到的图像是类似灰度的图像,可以用于各种目的,如:环境监测,海岸线监测,边境控制,以及其他与环境与安全地面监测(GMES)相关的主题。

    我们的研究涉及数千张非常高分辨率的地球图像(cosmos - skymed X-SAR SpotLight图像),这些图像每天都可用于与安全和风险预防相关的所有潜在应用。尽管这些图像的方位分辨率很高,但对于人眼来说,很难解释这些图像,特别是当需要精确理解小范围区域时,例如城市社区,场景中出现了自然和人造物体的几个细节。因此,解释问题是,建模场景中每个物体与其后向散射信号之间的关系,表示为图像强度值,并见证物体或其部分反射特定波长的亮度。
    在这一领域,我们的研究兴趣是基于定义一个模型来识别图像中出现的物体之间的关系和每个物体的后向散射属性,以便对这些图像进行自动解释。我们的方法的优点在于使用非常高分辨率的图像,一个像素代表不到1平方米。
    散斑噪声的存在会降低产生的图像,特别是在辐射信号的不同部分在传播过程中相互作用更频繁的区域(人口密集地区)。

    由于Alcor实验室在计算机视觉机器学习和模式识别领域的丰富经验,在第一阶段,我们想要定义一组特征,可以最好地表征不同的土壤和土地覆盖。因此,我们的工作主要集中在城市公园的X-SAR SpotLight图像上,因为它们可以有各种各样的土地覆盖,并且由于信号反射的不同,散斑噪声通常比其他区域低。
    计算机视觉界已经开发了许多算法来增强边缘、角落、不同的纹理,或重现人类的视觉系统,或压缩图像。但是这些特征提取器如何用于X-SAR图像分析和解释呢?
    到目前为止,我们的工作已经表明,一些特征,例如纹理特征,可以最好地模拟水,并且基于纹理的分割可以用于分割出水,效果很好,也适用于非常高分辨率的SpotLight X-SAR图像。然而,从另一个角度来看,当分辨率变得如此之高时,我们必须设计X-SAR调谐特征描述符来获得良好的分类。
  • 规划与认知机器人

  • 任务切换

  • 在现实世界中,机器人必须执行多个活动,需要适当设计的认知控制来选择和协调多个任务的操作。
    在神经科学研究中,认知控制是一种在执行给定任务所需的输入、内部状态和输出之间建立适当映射的能力。它经常借助抑制的概念进行分析,解释一个受试者如何在几种刺激的存在下选择性地做出反应,并能够抵抗不适当的冲动。认知控制作为一种通用功能,解释了在需要重新配置记忆和感知时,通过脱离以前的目标或任务集来灵活地在任务之间切换。
    自八十年代以来,在任务切换范式中研究认知控制,主要是人类自适应行为,对认知机器人架构产生了强烈影响。基于模型的执行机器人控制方法,通过入侵行为,通过实时选择、执行和动作指导来管理运行时系统的逆向抑制。这种基于模型的视图假设了执行程序的声明性(符号)模型的存在,认知控制可以使用该模型在响应式控制循环中的进程之间切换。
    在这种背景下,规划界提出的灵活的时间规划方法,在基于审议和执行一体化的现实世界应用中显示出强大的实际影响。这些方法融合了计划、调度和资源优化,用于管理许多机器人任务中涉及的所有竞争活动。灵活的时间规划方法支持时间约束网络,为不同事件和过程之间的行为、交互和时间切换提供了一个很好的模型。
    另一方面,从不同的角度来看,定性认知机器人1社区在行动和变化理论领域内引入了高级执行控制,如情境演算、流畅演算、事件演算、动作语言及其内置的代理编程语言,如Golog家族。在行动和变化框架理论中,执行控制问题主要是根据行动属性、它们对世界的影响(例如框架问题)和主体根据其愿望、意图和知识决定成功行动序列的能力来考虑的。
    尽管如此,反应性行为已经从由自然诱导的代理行为和外部外生行为的交织性质的观点来考虑。
    现实世界中的机器人应用越来越多地关注动作的属性,而且还关注系统对大量刺激的反应,需要处理响应时间。因此,在任务切换(视觉、定位、操作、探索等)中,需要协商反应的多样性,这对行动理论产生了不同的观点。
    例如,对代理编程语言或多种交互形式的日益重视导致了多代理系统的爆炸性增长。事实上,对来自环境的许多信息源的控制,以及对感知运动和选择过程的资源分配的仲裁,已经成为行动和行为建模的核心挑战。
    我们认为,在适应性、灵活性和切换行为的观点下,执行控制的复杂性要求设计一个有根据和解释性的框架,只有在行动、感知和互动的连贯和强有力的定性模型中才能实现。
    我们希望扩展情境演算的框架,适应Allen时间间隔、多个时间线和并发情况,以表示异构、并发和交织的灵活行为,服从切换时间标准。这导致了一种新的集成范式,其中多个并行时间线吸收了活动之间的时间限制。
  • 多通道HRI

  • 作为设计能够参与对话的机器人的一步,我们正在开发一个对话场景模型,其中音频和视觉线索结合起来执行多模态说话人识别。
    • 机器人会主动跟随对话

    • 它关注的是当前的演讲者

    • 多人脸检测和跟踪

  • 机器人及设备

    • 目光机

    • GAZE MACHINE是一种可穿戴设备,可以识别佩戴者在环境中的注视扫描路径。它可以很容易地穿戴,所以穿着它的受试者可以在任何光线条件下走动,无论是室内还是室外。
    • VICON MX

    • Vicon MX系统是目前最先进的光学运动捕捉系统。Vicon MX系统的主要组成部分是摄像头、控制硬件模块、分析和显示数据的软件以及运行软件的上位机。每个Vicon MX系统至少包括一个MX Giganet,为多达10个摄像头和其他设备提供电力和数据通信。
    • 塔洛斯

    • TALOS是一种履带式移动机器人,两侧有两个履带式转向架,前后有四个主动履带式脚蹼,这使它在崎岖地形中具有更高的机动性。它配备有源和无源传感器,即旋转2D SICK LMS-100激光器,Ladybug3全向摄像机,Xsense惯性测量单元(IMU), GPS和机载四核计算机。
    • SECURO代理人(虾)

    • Bluebotics ShrimpIII机械架构为机器人提供了令人难以置信的机动性。它能够在极具挑战性的地形中轻松移动,克服两倍于其车轮大小的垂直障碍,甚至可以爬楼梯。额外的有效载荷由一台轻型笔记本电脑、用于定位的传感器(惯性平台Crossbow)和用于图像采集的传感器(两台火线摄像机PtGrey Flea)、一组锂离子电池、通信(蓝牙和无线802.11a)组成。所有额外的载荷都安装在由碳纤维和有机玻璃制成的特别结构上。
    • DORO Agent2 (Pioneer P3-AT)

    • DORO Agent1 (Pioneer 3DX)

    • ActivMedia PIONEER 3-DX是一款灵活、多功能、智能的移动机器人平台,能够坚固地承载负载并穿越窗台,具有高性能管理,可在需要时提供动力。它被赋予:一个带有几个由盟军Vison Technologies Marlin提供的立体声相机的移动头部,一个用于定位的Xsens MT9惯性平台,八个声纳环宝丽来。其他部件包括:华硕M3000N笔记本电脑(centrino),激光DISTO徕卡,奥迪赛电池和相应的电源和支撑结构。笔记本电脑上安装的软件组件有:ActiveMedia提供的API ARIA和sapira, Matlab(包括图像采集、图像处理、神经网络、符号数学、统计、优化、小波、信号处理工具箱),编译器c++, prolog ECLIPSE框架,prolog解释器,Java。机器人的价值包括专门开发的定位、地图重建、通信和规划、导航和识别软件。
  • 计算机图形学

    • 计算机图形学

    • 计算机动画,物理模拟,GPGPU,虚拟人物动画

      我们的研究领域包括基于物理的仿真和虚拟人物动画合成,重点是在娱乐和医疗领域的应用。特别是研究的重点

      • 计算物理模型在软体模拟中的应用
      • 设计和实现适合现代图形处理器充分开发的并行仿真算法和数据结构。
      我们结合了强大的算法和计算机科学背景的经验和愿望,在涉及计算动画的应用问题上工作。

    • 三维虚拟人脸动画的计算模型

    • 面部运动的模拟是一项艰巨的任务,因为人类头部复杂而复杂的结构涉及到粘弹性、非线性、各向异性和结构异质的生物组织之间的运动、变形和接触处理。这使得很难建立一个能够代表面部生物力学内部运作的数学模型。尽管如此,高精度和精确度是必需的,因为作为人类,我们从出生的那一刻起就习惯于观察和解码面部表情,我们擅长轻松检测虚拟面部动画中最小的人工制品。

      我们开发了一种基于物理的综合方法,通过再现人类头部的肌肉骨骼结构以及骨骼结构、面部肌肉和皮肤之间的相互作用来模拟面部运动。实验表明,该模型能够有效地在消费者级平台上实时合成不同输入人脸模型的逼真表情人脸动画。

    • 基于gpu的软体动画

    • 消费类图形适配器已经从一般适用性非常有限的小型单元发展到在使用方面非常灵活的高功率计算设备。它们的计算能力和存储带宽在过去几年中有了巨大的增长。提供高级语言支持,最近的图形硬件能够在广泛的应用程序中胜过CPU集群。我们开发了一个用c++/CUDA编写的物理引擎,完全依赖于gpu的并行计算能力。然而,与以串行方式迭代求解物理约束不同,在预初始化阶段,引擎会创建几个不同的约束集群,这些集群可以通过红黑高斯-塞德尔求解器并行求解。通过这种方式,所获得的性能比串行方法快两个数量级,我们计划将这种引擎应用于不同的环境,特别是外科模拟器和自动虚拟角色动画。我们还研究了划分约束集的不同算法策略,以便在显卡上可用的多处理器之间实现可调的工作负载平衡
    • 多腿机器人仿真

    • 机器人仿真在开发机器人应用程序中非常重要,无论是对应用程序、行为、场景的快速原型化,还是对许多高级任务的调试目的。机器人模拟器一直被用于开发复杂的应用程序,模拟器的选择取决于我们感兴趣的具体任务。此外,模拟器对于机器人教育也非常重要:事实上,它们是强大的教学工具,允许学生在家开发和实验典型的机器人任务,而不需要他们使用真正的机器人。