基于人类-机器人交互来调节机器人行为的利记博彩app

文档序号:9422792阅读:612来源:国知局
基于人类-机器人交互来调节机器人行为的利记博彩app
【专利说明】基于人类-机器人交互来调节机器人行为 睛川宜量
[0002] 如本文中使用的术语,机器人是包括致使该机器人独立地且无需来自人类的协助 地执行功能的计算机硬件和软件的机电机器。当前市场上可购得的示例性机器人包括机器 人吸尘器和割草机。例如,传统的市场上可购得的机器人吸尘器包括计算机可执行指令, 当被机器人吸尘器的处理器执行时,该计算机可执行指令致使机器人吸尘器基于从机器人 吸尘器的传感器接收到的输入来自动地对特定区域(例如,一房间)进行吸尘。传统的市 场上可购得的机器人割草机被配置有计算机可执行指令,当被机器人割草机的处理器执行 时,该计算机可执行指令致使运样的机器人割草机自动地且无需人类干预地来收割特定区 域(例如,屋主的后院)中的草。
[0003] 随着时间推移,可W预期被配置来执行指定任务的移动机器人将会相对常见。当 前,在工业和家庭环境两者中,市场上可购得的机器人被硬编码W响应于接收传感器输入 来执行某些动作。例如,如果机器人割草机上的传感器在其路径中检测到障碍(诸如人 类),则由开发者编写的针对该机器人割草机的计算机可执行代码致使该机器人割草机停 止和/或改变方向。然而,传统的机器人设备对于处理更为复杂的场景而言是装备不良的。
[0004] SM
[0005] W下是在本文详细描述的主题的简要的
【发明内容】
。本
【发明内容】
不旨在是关于权利 要求的范围的限制。
[0006] 本文描述了关于自动地调节一环境中的移动机器人设备(机器人)的行为的各种 技术,其中移动机器人设备基于环境中感测到的条件W及相对于人类的任务已经被成功地 完成还是没有被成功地完成来操作。由此,机器人的行为被调节来增加机器人将相对于随 后进入机器人的环境的人类成功地完成任务的概率。在一示例性实施例中,机器人可习得 各技术,随着时间的推移,在给定环境中变化的条件的情况下,各技术增加任务将被机器人 成功完成的概率。
[0007] 更具体地,可W预期,移动机器人设备在社会的不同部分中的使用将在不久的将 来相对常见。运种从受控的环境(例如,工厂)到其中人们不断出现和四处移动的未被限 制的环境(例如,家、公共场所、医院等)的改变将提升对于机器人社会上可接受的"方 式来表现的需要W使得人类与运样的机器人进行交互。运种对于社会上可接受的行为的需 要可跨多个领域(例如,"我现在能发出声音吗?""我能移动多快而不使得人类感到不舒 月良?""我能基于已知的位置、行进的方向和运个人的行进的速率来在运个人前面穿过吗?" 等)。
[0008] 本文中描述的技术设及学习框架,该学习框架允许机器人根据在机器人的环境中 先前观察到的人类行为来调节其行为。在一示例性实施例中,该框架基于来自高斯回归过 程(GR巧之上的强化学习的原理的应用。运种学习框架可协助机器人针对每个机器人-人 类交互来调节其行为W增加机器人将相对于相应人类成功地完成预先定义的任务的概率。
[0009] 例如,理想地被机器人相对于人类完成的任务可W是使得人类与机器人在机器人 的环境中进行交互。一示例性交互可W是人类接受来自机器人的特定材料(例如,广告)。 另一示例性交互可W是人类向移动机器人设备阐述某些语音输入。又一示例性交互可W是 人类通过机器人的键盘或姿势W及其他等的方式来阐述某些其他想要的输入。机器人包 括多个传感器,该多个传感器被配置成输出代表环境的相应条件和/或机器人的条件的信 号。机器人的条件可W在机器人的控制下。例如,机器人的条件可包括机器人和人类之间 的距离、移动机器人W此靠近人类的角度、机器人的扬声器的音量、机器人输出的声音信号 的音调、机器人的速度和/或加速度等。环境的条件可W完全在机器人的控制之外,并可包 括例如,一天中的时间、溫度、人类行走的速度、人类的大小、人类的性别、人类的种族等。随 着时间的推移,通过观察(在机器人的控制下W及在机器人的控制之外两者的)条件并且 通过查明预先定义的任务是否被成功地完成,机器人(通过W上提到的学习框架)可调节 其行为来提升任务将针对环境中的后续人类(其中不同的条件被观察到)被成功完成的概 率。例如,对于特定环境,机器人可习得最优距离W相对于人类来针对一天中的特定时间和 性别来定位其自己,W最大化相对于该人类的任务将被成功地完成的概率。
[0010] W上概述呈现了简化概述,W便提供对本文讨论的系统和/或方法的某些方面的 基本理解。本概述并不是对本文所讨论的系统和/或方法的全面综述。并不旨在标识关键 /重要元素,也不描绘运样的系统和/或方法的范围。其唯一目的是W简化形式呈现一些概 念,作为稍后呈现的更详细说明的序言。
[0011] 附图简沐
[0012] 图1示出在特定环境中与人类交互的示例性移动机器人设备。
[0013] 图2示出示例性移动机器人设备。
[0014] 图3示出可被包括在移动机器人设备的计算机可读存储器中的示例性计算机可 执行组件。
[0015] 图4是示出用于使得移动机器人设备执行一动作的示例性方法的流程图,该动作 被习得来增加移动机器人设备将相对于人类成功地完成任务的概率。
[0016] 图5是示出用于更新当尝试使得人类与移动计算设备交互时被移动机器人设备 使用的习得的模型的示例性方法的流程图。
[0017] 图6是示例性计算系统。 W化]详细描沐
[0019] 现在参考附图来描述与人类-机器人交互有关的各种技术,其中在附图中贯穿始 终使用相同的附图标记来引述相同的要素。在W下描述中,出于解释的目的,提出了众多具 体细节W提供对一个或多个方面的全面理解。然而,显然运(些)方面可W在没有运些具 体细节的情况下被实践。在其他实例中,W框图形式示出公知的结构和设备W便于描述一 个或多个方面。另外,要理解,被描述为由特定系统组件执行的功能性可由多个组件执行。 类似地,例如,一组件可被配置成执行被描述为由多个组件执行的功能。
[0020] 此外,术语"或"意指包括性"或"而非排斥性"或"。目P,除非另有指定或从上下文 显而易见,否则短语"X采用A或B"意指任何自然的包括性排列。旨P,短语"X采用A或B" 藉由W下实例中任何实例得到满足:X采用A;X采用B;或X采用A和B两者。另外,本申 请和所附权利要求书中所使用的冠词"一"和"某"一般应当被解释成表示"一个或多个", 除非另外声明或者可从上下文中清楚看出是指单数形式。
[0021] 此外,如本文所使用的,术语"组件"和"系统"旨在包含用使得在被处理器执行时 执行特定功能性的计算机可执行指令配置的计算机可读数据存储。计算机可执行指令可包 括例程、功能等等。还要理解组件或系统可W位于单个设备上或跨若干设备分布。而且,此 处所用的术语"示例性"旨在表示用作某些事物的图示或示例,而不意图指示优选。
[0022] 现在参考图1,示出了其中移动机器人设备102(机器人)尝试相对于人类104完 成预先定义的任务的环境100。例如,环境100可W是其中机器人102和/或人类104相对 不受限制的环境。运与其中机器人被使用的传统环境相反,其中机器人被限制到特定区域, 并且它们与人类的交互也被类似限制。图1中所示的示例性环境100例如可W是公共环境, 诸如商场、机场、运动场、竞技场、公园、图书馆等。环境100还可W是相对私人的环境,诸如 医院、营业场所等。
[0023] 机器人102包括多个传感器106,该多个传感器106被配置成输出指示关于环境 100和/或机器人102的相应条件的信号。该多个传感器106可包括例如,时钟、溫度传感 器、深度传感器、摄像机、话筒、速度计、加速度计、巧螺仪、定位传感器等。关于环境100的 条件可包括一天中的时间、一星期中的一天、溫度、湿度、亮度、声学信号的音量、来自特定 人类的语音的音量、对象在环境100中的位置、人类104的大小、人类104的年纪、人类104 的性别或种族、人类104行进的方向、人类104行进的速度、人类104行进的加速度、人类 104的面部表情等。关于机器人102的条件包括但不限于包括,机器人102在环境100中的 位置、机器人102在环境100中相对于人类104的位置的位置、机器人102的扬声器输出的 音频的音量、机器人102发射的光的强度等。
[0024] 在一个示例性实施例中,该多个传感器106可包括摄像机,并且关于环境100和/ 或机器人102的条件可通过对由摄像机输出的视频信号的分析来查明。可被包括在传感器 106中的其他示例性传感器包括深度传感器、话筒、光传感器、速度计、加速度计、定位传感 器等。
[00巧]机器人102包括与一处理器(未显示)通信的驱动系统108,该处理器向运样的驱 动系统108传送致使机器人102转移到环境100中的所需位置的信号。驱动系统108包括 可被用于在环境100中转移机器人102的马达、相关联的传动装置等。
[00%] 在本文阐述的该示例中,机器人102被编程为用于相对于环境100中的人类完成 预先定义的任务。在一示例性实施例中,运类预先定义的任
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1