导航:EXPO21XX>自动化21 xx>H05:机器人大学和研究>爱丁堡大学,莱比锡,Göttingen
爱丁堡大学,莱比锡,Göttingen
视频
加载播放器…
  • 提供配置文件

  • 我们的机器人具有固定的形态(到目前为止没有考虑到结构自组织),其“大脑”由两个人工神经网络组成,一个用于控制,另一个用于认知,即“理解”机器人对控制的反应。我们的方法的要点是,两个网络中的学习都是自监督的,由完全域不变的目标函数驱动,完全依赖于机器人的传感器值。
产品组合
  • 自组织生物的世界

      • 自组织是我们这个世界上最引人注目的现象之一。甚至进化也可以被看作是自然在凡人的约束下在永恒的资源争夺中实现自我组织的方式。因此,一旦解决方案确立,进化就是一个建立在解决方案基础上的增量过程。机器人可以被认为不受这些令人窒息的限制。相反,他们可能是不朽的,没有能量限制。那么,我们的问题是如何在这样一个为每个机器人开放的世界中组织自组织,为个体的开放式发展开辟道路。

        我们的机器人具有固定的形态(到目前为止没有考虑到结构自组织),其“大脑”由两个人工神经网络组成,一个用于控制,另一个用于认知,即“理解”机器人对控制的反应。我们的方法的要点是,两个网络中的学习都是自监督的,由完全域不变的目标函数驱动,完全依赖于机器人的传感器值。目标主要是使机器人灵敏,使传感器值的微小变化引起电机值的大变化,从而产生更大的感觉反应等等。这将使机器人表现出极度活跃、混乱的行为。机器人本身的物理特性(惯性、交叉关系……)和混乱状态下理解能力的下降,抵消了进入完全混乱状态的途径。作为这些相互冲突的影响的解决方案,机器人以一种或多或少有趣的方式发展了一种对其身体可见性的自我探索,由于认知能力的增强而有发展的趋势。

        我们在这里给出了一些例子,证明这一原理,也称为同源运动原理,可以转化为一个可靠的,极其鲁棒的算法,它控制了神经网络的参数动态自模型和控制器。视频来自模拟环境,也来自真实世界的实验。

        信息和复杂性

        对于自主机器人领域来说,复杂性度量是一种对行为进行分类的手段,也是机器人行为自组织和自主发展的目标函数。在最近的一篇论文和一篇演讲中,我们将传感器空间中的预测信息作为一种测量两轮机器人链行为复杂性的方法,这些机器人链是由每个机器人的闭环反应控制器被动耦合和控制的。发现单个机器人传感器值的预测信息(近似于时间步长的互信息)对于控制器具有明确的最大值,控制器实现了机器人的自发合作,从而使链条整体在给定环境中发展出探索行为。在视频中,机器人由控制器驱动,控制器将当前车轮速度x(i)视为传感器输入,并产生电机值(名义车轮速度)y(i)为
        y(i) = tanh(C[i,1] x(1) + C[i,2] x(2))
        I = 1,2是轮轴下标。没有其他传感器,比如报告碰撞或测量机器人之间的耦合力。链中的每个机器人都有一个具有相同参数集的控制器。机器人链的行为非常敏感地依赖于单个控制器的参数C[i,j]。粗略地说,这些参数在感觉运动回路中定义了一种geheralized的反馈强度。如果反馈在一个临界值附近,控制器对链条中其他机器人施加在车轮速度上的扰动反应非常敏感,因此车轮速度的同步成为可能。在下面的视频中,我们展示了在最大值和远离最大值时具有不同预测信息值的行为。
        为了理解行为和预测信息(PI)之间的关系,我们注意到,作为经验法则,如果行为丰富(高活动,探索传感器值的空间),但不太混乱或随机,那么PI就高,这样未来的传感器值(在下一个时间步骤中)至少在一定程度上仍然是可预测的。

        结论与展望


        我们的自组织控制方法可以被认为是迈向自主早期机器人发展的一步,这意味着一个无偏见的机器人
        可以通过自我探索来学习基本的感觉运动协调。通过产生有目的的行为来防止内在模式的丧失。我们的方法完全是领域不变的,因此出现的行为是由身体和环境的物理属性决定的。未来的研究将导向塑造行为和更高层次的控制。



        软件


        在这个页面上,您将找到由我们小组开发的软件。该综合软件包称为lpzrobots,包含许多子项目。最重要的是selforg和ode_robots。第一个是实现控制器的框架,其中还包含不同版本的家庭动力学控制器的实现。ode_robots是一个三维物理真实的机器人模拟器。这两个项目主要由Georg Martius开发。您可以将其作为一个一体化的buddle来获得,也可以独立下载子项目(目前只有一些子项目作为独立的软件包提供)。为了便于安装,我们还提供了预编译的库和所需的外部库的devel文件。所有软件都是在Linux下开发的,可能不会在其他地方编译。我们的大部分代码都是在GPL下授权的。 However some parts, especially the controllers are copyrighted with Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.

        lpzrobots项目是用c++编程的,包括:

        Selforg:我们的自组织行为控制器,以及使用它们的小框架。
        Guilogger:协调多个gnuplot窗口并允许切换频道的应用程序。数据可以按管道发送,也可以从文件中读取。
        ode_robots: 3D机器人模拟器。它使用ODE (Open Dynamics Engine)和OSG (OpenSceneGraph)。模拟器不能作为一个独立的包使用,因为它需要所有其他模块。
        opende: ODE的副本,可以很好地与我们的模拟器(0.9)一起工作