AI向真正“智能学习体”迈进_直销报道网-行业新闻门户网站

【直报网北京2月25日讯】（科技日报）科技日报北京2月24日电（记者张梦然)英国《自然》杂志24日发表一项人工智能研究成果：美国团队报告了一类增强学习，可回溯过去、解决复杂任务，真正改善了对复杂环境的探索方式，有望应用于机器人、语言理解和药物设计领域。这类算法被统称为“Go-Explore”，其已经在一款经典游戏的算法挑战中得分超过了人类玩家和先进的人工智能系统。该成果被认为正朝着实现真正“智能学习体”迈出了重要一步。

增强学习，可让人工智能系统通过探索和理解复杂环境来进行决策，并学习如何以最优的方式获得奖励。奖励可以包括机器人抵达特定位置或是在电脑游戏中达到一定的等级。然而，当遇到很少给予反馈的复杂环境时，现阶段的加强学习算法就很容易碰壁，这让人工智能专家们非常苦恼。

美国“OpenAI”是由诸多硅谷巨头联合建立的人工智能非营利组织，推动者包括美国创业孵化器Y Combinator总裁萨姆·阿尔特曼、美国太空技术探索公司（SpaceX）创始人埃隆·马斯克等，其目标是希望能够预防人工智能的灾难性影响，并推动人工智能发挥积极作用。此次，“OpenAI”的科学家艾德兰·艾克菲特、朱斯特·赫伊津哈及团队，提出了有效探索面临的两个主要障碍，并设计了一类算法来解决这些障碍。

研究人员表示，“Go-Explore”可以对环境进行全面探索，同时构建一个档案库来记住它去过的地方，确保自己不会忘记通往有望成功的期中阶段或是最终胜利（奖励）的路线。其在雅达利经典游戏中的得分，超过了人类玩家和先进的人工智能系统，研究人员用这类算法，解决了之前未能解决的2600个雅达利游戏，验证了这类算法的潜力。“Go-Explore”在算法挑战《蒙特祖马的复仇》中的得分是之前的4倍，在另一个算法挑战《玛雅人的冒险》中的得分也超过了人类玩家的平均水平。而相对的，此前的算法一分都拿不到。

“Go-Explore”算法还能完成一个模拟机器人任务，在这项任务中，它必须用机械臂把东西捡起来并放到4个架子中的一个架子上，其中两个架子被关在两扇门的后面。

研究人员指出，记住并回到有望成功的探索区域的简单原则是一种强大、通用的探索方法。他们认为最新的算法有望应用于机器人、语言理解和药物设计。

（原标题：AI向真正“智能学习体”迈进）

责编：小美

【特别声明：部分文字及图片来源于网络，仅供学习和交流使用，不具有任何商业用途，其目的在于传递更多的信息，并不代表本平台赞同其观点。版权归原作者所有，如涉版权或来源标注有误，请及时和我们取得联系，我们将迅速处理，谢谢!】

解读新闻热点、呈现敏感事件、更多独家分析，尽在以下微信公号，扫描二维码免费阅读。

·让虚拟与现实相互激发	·春节期间网络支付交易金额达4.98万亿元
·2021年货币政策重在兼顾内外部平衡	·关于“钱”，年轻人这么看（中国青年观察④）
·大数据透露春节消费新趋势	·牛年市场迎来开门红
·数字人民币支付上线多种新玩法	·已故存款人小额存款提取手续将简化
·春节社交磁力大巨头打响红包战	·中国“数字经济”有望持续领跑
·牛年见喜外资大块头纷纷入华	·遭遇教培合同纠纷消费者如何维权？
·人口拐点临近，养老经济如何破题	·大数据显示：单人份年夜饭预订搜索猛增
·政策密集落地 2021年金融监管“铁腕”开局	·鼓励就地过年多部门齐发政策“大礼包”
·就地过年，年货市场年味同样浓	·海关：持续严厉打击洋垃圾走私
·网络零售市场规模再创新高呈现三大特点	·春节航空返乡旅客将减少600万人次

康宝莱首席财务官：危机

宝哥相对论：发扬“三牛

绿之韵胡国安：优秀提案

AI向真正“智能学习体”迈进