人类通过各种感官系统来认识世界,比如触觉、嗅觉和味觉等等。同样,对于机器人而言,能够感知和理解周围的世界对于简化集成至关重要。目前,不来梅大学和德国慕尼黑大学的一组研究人员开发了一种认知感知系统,可以增强移动机器人在日常操纵任务中的性能。
在过去十年,机器学习的进步推动了自动驾驶汽车、虚拟助手和移动机器人等智能化系统的发展。除此之外,开发智能系统的研究人员需要确定集成组件的方法,这些组件旨在处理不同但又互补的子任务。
例如,在家庭中完成家务任务的机器人应该能够感知其环境中的对象,同时检索这些对象的信息,这些信息可以用于计划其下一步动作。这个过程也被称为“感知-认知-行动”范式,具有至关重要的意义,因为它最终允许机器人提出有用的策略和有效地完成任务。

对早餐场景的语义丰富的描述
在设计智能自主系统时,一个紧迫的问题是如何将与互补任务相关的各个子系统进行集成。更具体地说,机器人视觉必须为各种规划相关模块提供与环境和环境中的物体相关的任务信息。
到目前为止,大多数在机器人中实现这种感知——认知——行动范例的方法,都将这叁个任务视为完全独立的模块,它们之间的功能就像黑匣子一样。但是,不来梅大学和德国慕尼黑大学的一组研究人员认为,将机器人的“感知”系统与其认知(即其“推理”或检索周围环境中物体信息的能力)联系起来,从而大大改善其整体性能。

经典的感知动作循环
考虑到这一点,研究人员最近开发了一种认知感知系统,可以增强移动机器人在日常操纵任务中的性能。这个名为搁翱叠翱厂贬贰搁尝翱颁碍的系统通过内容分析(颁础)获得感知,该策略需要使用统计方法来分析大量数据。

搁辞产辞厂丑别谤濒辞肠办执行任务流程
搁翱叠翱厂贬贰搁尝翱颁碍分析的数据是“非结构化”的,因为它的结构不像在数据库或电子表格中那样反映与它相关的语义。因此,该系统使用一种称为非结构化信息管理(鲍滨惭)的策略,这意味着它可以使用一组信息提取算法处理大量的非结构化数据,例如,文本文档,音频文件,图像等。每一种算法根据其“专长”提取不同类型的知识,然后对它们进行评级,并将它们结合起来,得出一个一致的决策。
在ROBOSHERLOCK中,现实场景的感知和解释被表述为一个非结构化信息管理(UIM)问题。UIM原理的应用支持感知系统的实施,该感知系统可以回答与场景中对象相关的任务相关查询,通过结合多种感知算法的优势来提高对象识别性能,支持基于知识的对象推理,并实现自动和 知识驱动的处理管道生成。
研究人员通过一系列测试评估了他们的框架,并将其应用于不同的系统以获得真实场景的感知。他们发现“推理”通过它的算法检索到的背景知识,允许搁翱叠翱厂贬贰搁尝翱颁碍回答各种各样的问题,比周围环境中可以直接感知到更多。

搁翱叠翱厂贬贰搁尝翱颁碍框架
研究人员在最近的研究中提出的搁翱叠翱厂贬贰搁尝翱颁碍可以被视为它的核心功能部分。随后,研究人员还开发了几个扩展来增强系统的认知能力。例如,他们创建了一个扩展,该扩展允许系统同时检测人类和物体,从而推断人类正在执行的动作以及这些动作的意图。
研究人员在论文中写道:“最近,我们已经研究了搁翱叠翱厂贬贰搁尝翱颁碍框架如何使智能体能够认知,并使用最先进的游戏引擎生成任务的变体并学习新的感知模型。所有这些扩展都是从机器人执行任务的角度着眼于机器人感知,如果没有核心框架ROBOSHERLOCK,这是不可能的。”
论文链接:RoboSherlock: cognition-enabled robot perception for everyday manipulation tasks. arXiv:1911.10079 [cs.RO]. arxiv.org/abs/1911.10079
投诉侵权