bet356娱乐场官网_bet3365娱乐场手机版_365bet体育在线投注

关于我们

bet356娱乐场官网_bet3365娱乐场手机版_365bet体育在线投注

智能体要在随机的、数以百计的不同楼层平面图(每个平面都是仿照现实家庭进行建模)中运行

时间:2018-05-15 11:15:01    作者:Bart    来源:网络整理

智能体要在随机的、数以百计的不同楼层平面图(每个平面都是仿照事实家庭停止建模)中运转

智能体要在随机的、数以百计的不同楼层平面图(每个平面都是仿照事实家庭停止建模)中运转

通过训练的 EmbodiedQA 智能体与标准序列模型基准(一个 LSTM 导航器)相比,体现的相当正当。

智能体要在随机的、数以百计的不同楼层平面图(每个平面都是仿照事实家庭停止建模)中运转

让自主系统愈加自主

该视频比较了 FAIR 开发的智能体(称号为 ACT+Q-RL)与基准的功能体现(称号为 LSTM+Q)。视频地址 https://youtu.be/gVj-TelJfrk

大少数可以与人类停止互动的自主智能体(Autonomous agents)都存在一些共同点:它们并不是那么自力更生(Self-sufficient)。例如,一个智能音箱(Smart speaker)只管可能经过语音接口与人类停止交换并采取一些动作(比如订购产品),然而它却无奈感知周围环境。而另一方面,割草机器人只管具有动作(割草)和感知(经过传感器)才能,然而它除了始终闪动灯光或许发送谬误信息以外,还无奈完成与客人的自由交换。

最后,由于 FAIR 的指标是超越繁琐的、逐步的人为监视,从强劲和远期的指标驱动奖励中学习,所以智能体必须学会的最重要的才能之一是「功劳分配(Credit assignment)」,这象征着智能体可以知道本人一路上所做的行为哪些是正确的而哪些又是谬误的。例如,假设讯问「多少个房间里有椅子?」,然后智能体并没有被明白告知需求反省每一个房间,,,甚至没有原告知要从家中含有椅子的区域末尾计算。智能体可以仰仗本人的力气去探求和答复成绩,而不需求借助人类提供的具体的逐步方案。因此,从它能否正确答复的一个强劲信号来看,它必须自行学习其数百项相互依赖的举动中是哪一项导致了胜利。为了增强传统的强化学习,FAIR 利用模仿学习(Imitation learning,比较智能体的静止与到达指标的能够最短门路)和奖励塑造(Reward shaping,经过「变得更近」和「变得更远」信号随工夫变化而改进智能体的体现)来容许智能体把它真正使命拼凑起来,即便该使命在末尾时并不清晰。

下一步,智能体必须学会常识推理,然后在一个新的然而却并非齐全陌生的环境中去施展作用。虽然人们能够知道车库往往位于屋宇的周围,因此可能经过外部门进入,然而 AI 系统却需求本人去学习这些知识。随着在不同的模拟家庭中胜利达到指标,智能体必须发展出这种常识,以延长寻觅指定对象然后答复相干成绩所花费的工夫。

为了测试这种指标导向(Goal-driven)的方法,FAIR 和佐治亚理工学院联结提出了一个多步骤 AI 义务,称为「详细化问答(Embodied Question Answering)」或许「EmbodiedQA」。与聊天机器人或许智能音箱相比,此智能体必须在物理环境(虽然是虚构环境)中去学习和运转,因此称为「详细化的(Embodied)」。当智能体被问及单一成绩时,例如「车子是什么色彩的?」或「我的钥匙落在了哪个房间里?」,智能体必须可以理解书面言语,然后用第一人称相机去感知周围环境,探求 3D 的室内环境直到找到答案。并且为了使得智能体的自主性愈加欠缺,它还将经过人造言语的模式回复该答案以实现本人的使命。

FAIR 提出了一项新的 AI 义务——详细化问答(Embodied Question Answering)。上图中在一个 3D 环境中的某个随机地位产生一个智能体,并给出一个成绩(车是什么色彩的?)。为了答复这个成绩,智能体必须借助智能导航以探求环境,经过第一人称(以自我为中心)的视觉搜集信息,然后答复成绩(橙色)。

Facebook 最新钻研:自主学习一个会和世界互动的智能体

2018-05-10 14:46 起源:雷锋网 Facebook /人工智能 /机器人

只管 EmbodiedQA 是只涵盖了一种指标驱动的自主义务,然而它却代表了人工智能的高难度(由于它将各种各样的子义务合并成了一个义务),并且无时机探求采取「举动」的新学习范式,这是胜利的先决条件。无奈做出决策的智能体——在这种情况下,经过在事实家庭中导航,确定它们搜集到了相干的数据,然后传达它们发现的内容——这种智能体在咱们的试验中是无奈实现义务的。

雷锋网 AI 科技评论按:本文由来自 Facebook 人工智能钻研院的钻研员 Dhruv Batra 和 Devi Parikh 共同撰写,文中引见了 Facebook 关于自主智能体的最新钻研成果——指标驱动自主学习,并且还宣布了开源 EmbodiedQA 和 House3D 数据集,雷锋网 AI 科技评论依据原文停止了编译。

FAIR 相信这些是第一个要求 AI 系统综合展示感知、交换和动作以达成指标的试验。将齐全自主(智能体在没有人类疏导和干涉的情况下完成了自主流动)和不相熟的环境联合起来添加了整个义务的应战性。智能体要在随机的、数以百计的不同楼层平面图(每个平面都是仿照事实家庭停止建模)中运转,而且不具备在该环境中实际运转过所带来的增益,也未曾在类似的地图上运转过。更难的是,为了答复提出的成绩,智能体必须移动,由于成绩中的对象兴许无奈立即看到。

原题目:Facebook 最新钻研:自主学习一个会和世界互动的智能体

相关文章


Copyright © 2012-2018 bet356娱乐场官网_bet3365娱乐场手机版_365bet体育在线投注 版权所有 京ICP备11088888号-1 公网安备110188808888号

技术支持:bet356娱乐场官网