导航:EXPO21XX>自动化21 xx>H05:机器人的大学和研究罗马大学(Sapienza university
视频
加载播放器…
  • 提供配置文件
  • ALCOR成立于1998年。研究活动主要集中在认知机器人系统应该能够激活的感知推理过程。

    我们研究和发展了与感知过程相关的表征方法和推理方法。从早期注意开始,我们研究了由运动、动作、互动引起的视听显著性的许多方面。我们还感兴趣的是,如何对突出性概念的这些不同方面进行分类,从而识别人类行为的不同模式,以及总体上如何识别事件在环境中如何展开。
产品组合
  • 实验室

  • 我们的目的是强调识别过程是一个有效的推理过程,它可以告知和确定关于环境的知识的形成,关于事件是如何被确定和诱导的,以及关于它们的时空关系。我们从识别过程、三维重建、人物面部表情解读、动作解读、形状分析、视听场景中的自下而上关注、用于视觉定位的自然图像、动作预测的概率和逻辑模型等不同方面进行了研究。我们的大多数实验都使用了Gaze机器,这是一种正在逐步发展的设备。
  • 视觉与知觉

  • 人类行为识别

  • 识别人的行为是用户友好、高水平人机交互的先决条件。此外,它还提供了通过演示来训练自主系统的方法,以发展执行动作所必需的技能。

    为了感知人类行为,我们使用了各种传感器,从全方位摄像头到深度传感器(如Kinect),以便构建和利用基于模型的人类表示,同时识别行动背景。沿着人体动作识别过程的管道,我们的研究方向是基于水平集方法的非刚性形状分析和重建以及位姿不变形状匹配。
  • X-SAR图像分类

  • 在过去的几十年里,SAR图像已经成为遥感工业中最有前途的产品之一。在卫星平台上,由于天线的移动,对信号的频率(微波域)和源与目标之间的距离,可以获得小于一米的空间分辨率。这些图像的获取要归功于SAR传感器的使用,该传感器可以探测到物体表面反向散射的辐射。目前,配备SAR传感器的两个最重要的卫星任务是意大利(ASI)名为cosmos - skymed的小卫星星座,以及德国航空航天中心(DLR)的TerraSAR-X卫星。所有这些卫星都在太阳同步轨道上,距离地球表面约600公里,使用X波段(8-12千兆赫)的信号。采集方式可以从:大区域扫描到聚光灯图像。微波域保证了高穿透云和大气,并且由于SAR是一个主动系统,所获取的图像不依赖于照明条件。生成的图像是类似灰度的图像,可以用于各种目的,如:环境监测、海岸线监视、边境控制以及与环境和安全地面监测(GMES)相关的其他主题。

    我们的研究涉及成千上万的非常高分辨率的地球图像(cosmos - skymed X-SAR聚光灯图像),这些图像每天可用于与安全和风险预防相关的所有潜在应用。尽管这些图像的方位角分辨率很高,但人眼很难解释这些图像,特别是当需要精确理解小尺度区域时,比如城市社区,自然和人造物体的几个细节出现在场景中。因此,解译问题是模拟场景中每个物体与其背散射信号之间的关系,用图像强度值表示,并见证物体或其部分反射特定波长的亮度。
    在这个领域,我们的研究兴趣是基于定义一个模型来识别图像中出现的物体之间的关系和每个物体的后向散射特性,以便推导出这些图像的自动解释。我们的方法的优势在于使用非常高分辨率的图像,像素代表不到1平方米。
    散斑噪声的存在会降低最终图像的质量,特别是在辐射信号的不同部分在传播过程中相互作用更频繁的地区(人口稠密地区)。

    由于Alcor实验室在计算机视觉机器学习和模式识别领域的丰富经验,在第一阶段,我们希望定义一组可以最好地表征不同土壤和土地覆盖的特征。因此,我们的工作主要集中在城市公园的X-SAR聚光灯图像上,因为它们可以有各种各样的土地覆盖,并且由于不同的信号反射,斑点噪声通常比其他区域低。
    在计算机视觉领域已经开发了许多算法来增强边缘、角落、不同的纹理,或重现人类视觉系统,或压缩图像。但是如何将这些特征提取器用于X-SAR图像的分析和解译呢?
    到目前为止,我们的努力已经表明,一些特征,如纹理特征,可以最好地模拟水,并且基于纹理的分割可以用来分割出水,效果很好,对于非常高分辨率的SpotLight X-SAR图像也是如此。然而,从另一个角度来看,我们看到,当分辨率变得如此之高时,必须设计X-SAR调优特征描述符以获得良好的分类。
  • 规划与认知机器人

  • 任务切换

  • 在现实世界中,机器人必须执行一些活动,这些活动需要一个适当设计的认知控制来选择和协调多个任务的操作。
    在神经科学研究中,认知控制是指在执行给定任务所需的输入、内部状态和输出之间建立适当映射的能力。它经常借助抑制的概念来分析,解释一个主体在几种刺激存在时如何有选择性地做出反应,并能够抵制不适当的冲动。认知控制作为一种一般功能,解释了当需要重新配置记忆和感知时,通过脱离先前的目标或任务集,在任务之间灵活切换。
    自80年代以来,在任务转换范式中对认知控制和主要是人类适应行为的研究强烈地影响了认知机器人架构。基于模型的执行机器人控制方法,以及通过黑客行为通过实时选择、执行和行动指导来管理向后抑制的运行时系统。这种基于模型的视图假定存在执行的声明性(符号)模型,认知控制可以使用该模型在反应性控制循环中的进程之间切换。
    在这种背景下,规划界提出的基于审议和执行一体化的灵活时间规划方法在现实世界的应用中显示出强大的实际影响。这些方法合并了计划、调度和资源优化,以管理许多机器人任务中涉及的所有竞争活动。灵活的时间规划方法支持时间约束网络,为不同事件和过程之间的行为交互和时间切换提供了良好的模型。
    另一方面,从另一个不同的角度来看,高水平的执行控制已经在定性认知机器人社区中引入,在行动和变化理论的领域内,如情境演算,流畅演算,事件演算,动作语言及其内置的代理编程语言,如Golog家族。在行动和变化框架理论中,执行控制问题主要是从行动属性、它们对世界的影响(例如框架问题)和行动者根据其愿望、意图和知识决定成功行动序列的能力方面来考虑的。
    尽管如此,反应性行为已被考虑从交错性质的代理人行动和外部外生行动,由自然诱导。
    现实世界的机器人应用越来越关注的不仅仅是动作的属性,还包括系统对大量刺激的反应,需要处理响应时间。因此,需要在任务切换(视觉、定位、操作、探索等)中协商反应的多样性,这是行动理论的不同观点。
    一个例子是越来越强调智能体编程语言或多种形式的交互,导致了多智能体系统的爆炸性增长。事实上,对来自环境的许多信息来源的控制,以及对感知-运动和选择过程的资源分配的仲裁,已经成为行动和行为建模的核心挑战。
    我们认为,在适应性、灵活和转换行为的观点下,执行控制的复杂性要求设计一个有根据和可解释性的框架,只有在行动、感知和相互作用的连贯和强有力的定性模型中才能完成。
    我们想扩展情况演算的框架,以适应Allen时间间隔、多个时间线和并发的情况,以表示异构、并发和交错的灵活行为,服从于切换时间标准。这导致了一个新的集成范例,在这个范例中,多个平行的时间线吸收了活动之间的时间约束。
  • 多通道HRI

  • 作为设计可以参与对话的机器人的一步,我们正在开发一个对话场景模型,其中音频和视觉线索相结合来执行多模态说话人识别。
    • 机器人会主动跟随对话

    • 它关注的是当前的说话人

    • 多人脸检测和跟踪

  • 机器人与设备

    • 目光机

    • 凝视机器是一种可穿戴设备,可以识别佩戴者在环境中的凝视扫描路径。它可以很容易地佩戴,所以穿着它的人可以在任何光线条件下走动,无论是室内还是室外。
    • VICON MX

    • Vicon MX系统是目前最先进的光学运动捕捉系统。Vicon MX系统的主要组成部分是摄像机、控制硬件模块、分析和呈现数据的软件以及运行软件的主机。每个Vicon MX系统包括至少一个MX Giganet,为多达10个摄像机和其他设备提供电源和数据通信。
    • 塔洛斯

    • TALOS是一种履带式移动机器人,两侧有两个履带式转向架,前后各有四个主动履带式脚蹼,这赋予了它在崎岖地形上增加的机动性。它配备了主动和被动传感器,即旋转2D SICK LMS-100激光器,Ladybug3全向相机,Xsense惯性测量单元(IMU), GPS和机载四核计算机。
    • 证券代理人(虾米)

    • ShrimpIII的机械结构为机器人提供了令人难以置信的机动性。它能够在非常具有挑战性的地形上轻松移动,克服两倍于车轮大小的垂直障碍,甚至可以爬楼梯。额外的有效载荷由一台轻型笔记本电脑、定位传感器(惯性平台Crossbow)和图像采集传感器(两台火线摄像机PtGrey Flea)、一组锂离子电池、通信(蓝牙和无线802.11a)组成。所有额外的有效载荷都安装在由碳纤维和有机玻璃制成的特殊结构上。
    • DORO Agent2(先锋P3-AT)

    • DORO Agent1(先锋3DX)

    • ActivMedia PIONEER 3-DX是一款灵活、多功能、智能的移动机器人平台,能够强大地承载负载并跨越技能,具有高性能的管理,以便在需要时提供电源。它被赋予了:一个带有一对由Allied vision Technologies Marlin提供的立体摄像头的移动头部,一个用于定位的惯性平台Xsens MT9,八个声纳环宝丽来。其他部件包括:一台华硕M3000N笔记本电脑(centrino),一台激光DISTO徕卡,奥迪赛电池和相应的电源以及一个支撑结构。本笔记本电脑安装的软件组件有:ActiveMedia提供的API ARIA和Saphira、Matlab(包括图像采集、图像处理、神经网络、符号数学、统计学、优化、小波、信号处理工具箱)、编译器c++、prolog ECLIPSE框架、prolog解释器、Java。机器人的价值包括专门开发的定位、地图重建、通信和规划、导航和识别软件。
  • 计算机图形学

    • 计算机图形学

    • 计算机动画,物理仿真,GPGPU,虚拟人物动画

      我们的研究方向是基于物理的仿真和虚拟人物动画合成,重点是在娱乐和医疗领域的应用。研究的重点是

      • 计算物理模型在软体仿真中的应用
      • 设计和实现适合充分利用现代gpu的并行仿真算法和数据结构。
      我们将强大的算法和计算机科学背景与涉及计算动画的应用问题的工作经验和愿望相结合。

    • 三维虚拟人脸动画的计算模型

    • 面部运动的模拟是一项艰巨的任务,因为人类头部复杂而复杂的结构涉及到粘弹性、非线性、各向异性和结构异质性的生物组织之间的运动、变形和接触处理。这使得很难建立一个能够代表面部生物力学内部工作的数学模型。然而,由于人类从出生的那一刻起就习惯于观察和解码面部表情,并且我们擅长轻松地检测虚拟面部动画中最小的伪影,因此需要高精度和高精度。

      我们开发了一种综合的基于物理的方法,通过复制人类头部的肌肉骨骼结构以及骨骼结构,面部肌肉和皮肤之间的相互作用来模拟面部运动。实验表明,通过该模型可以在消费者级平台上对不同输入人脸模型实时有效地合成逼真的表情面部动画。

    • 基于gpu的软体动画

    • 消费类图形适配器已经从一般适用性非常有限的小型设备发展到在使用方面非常灵活的高性能计算设备。在过去的几年里,它们的计算能力和存储带宽得到了巨大的提高。由于提供高级语言支持,最新的图形硬件能够在广泛的应用程序中胜过CPU集群。我们开发了一个用c++/CUDA编写的物理引擎,完全依赖于gpu的并行计算能力。然而,在预初始化阶段,引擎不是以串行方式迭代地求解物理约束,而是创建几个不同的约束集群,这些约束可以通过红黑高斯-赛德尔求解器并行求解。通过这种方式,获得的性能比串行方法快两个数量级,我们计划将这种引擎应用于不同的上下文中,特别是手术模拟器和自动虚拟角色动画。我们还研究了对约束集进行分区的不同算法策略,以便在显卡上可用的多处理器之间实现可调的工作负载平衡
    • 多足机器人仿真

    • 机器人仿真在开发机器人应用程序中非常重要,无论是用于应用程序、行为、场景的快速原型设计,还是用于许多高级任务的调试目的。机器人模拟器一直被用于开发复杂的应用程序,而模拟器的选择取决于我们感兴趣的具体任务。此外,模拟器对机器人教育也非常重要:事实上,它们是强大的教学工具,允许学生在家中开发和实验典型的机器人任务,而不需要他们使用真正的机器人。