下完围棋大全完整版打星际 为什么DeepMind的AI机器人那么爱玩

您所在的位置:
学会了围棋后 谷歌DeepMind的AI又开始玩游戏了
11:53:57 &&&&来源: itwriter
  6 月 18 日,据科技博客 VentureBeat 报道,提到谷歌的 DeepMind 人工智能,大家首先想到的一定是击败韩国棋手李世石的 AlphaGo,不过后来它又学(本文来自:湖北+招考网)了走迷宫等新招数,现在 AlphaGo 又开始了自己新的征程。
  今天,谷歌 DeepMind 实验室宣布它们开始了新的实验,其中包括在游戏中训练一只(本文来自:湖北考试网e&d&)蚂蚁将球射进球门。是不是觉得这比下围棋简单多了?其实不然,亚马逊、苹果、Facebook 和微软都正在该领域进行着相关研究。
  &我们还打造了一个分布式的大型深度强化学习(reinforcement learning)系统并将其命名为 Gorila,该系统利用 Google Cloud 平台大幅提高了训练效率,眼下(本文来源:湖北考试网/)该系统已经开始为谷歌的个性化推荐系统服务。&谷歌 DeepMind 实验室的席尔瓦在博客中写道。
  强化学习涉及我们熟悉的试错学习项目,DeepMind 实验室将其与深度学习相结合,以便获得更强的推理能力。
  在博客中,席尔瓦还提到了许多 DeepMind 实验室的研究项目。(本文来自:湖北www.考试网)
  &为了解决连续控制问题,如机器人操作和运动,我们还专门开发了许多深度强化学习方法,这些方法可以很好的解决蚂蚁踢球等问题。&席尔瓦说道。未来几个月内,DeepMind 实验室还将发布开源的迷宫软件。
[责任编辑:Admin]
【&&】【】
加入收藏 | 旗下:
Copyright &
All Rights Reserved
站务: 广告: 邮箱:(娱乐类除外)
分流站&湖北唯一PR8的教育门户谷歌围棋程序击败欧洲冠军 人工智能重大飞跃!_凤凰资讯
凤凰资讯出品
谷歌围棋程序击败欧洲冠军 人工智能重大飞跃!
作者:边驿卒 第272期
《自然》杂志27日发文,围棋电脑软件“AlphaGo”(阿尔法围棋)打败了职业棋手。这个软件由谷歌旗下的人工智能(AI)开发商“DeepMind”所研发。机器人闯进了围棋界?
机器人闯进了围棋界? 《自然》杂志27日发文,围棋电脑软件&AlphaGo&(以下称&阿尔法围棋&)打败了职业棋手,震撼了国际棋坛。这个软件由谷歌旗下的人工智能(AI)开发商&DeepMind&所研发,所以这个消息也令人工智能科学家们感到震撼。
自然杂志封面 这款名为&阿尔法围棋&的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。 你可能想到了1997年计算机程序&深蓝&和国际象棋大师卡斯帕罗夫的世纪之战。在那次比赛中,卡斯帕罗夫输给了这个IBM开发的计算机程序。这是人工智能历史上的划时代事件。 而这次比赛的意义毫不逊色。 1997年,当IBM深蓝计算机在象棋上称霸时,它使用的是手工编码的规则,在搜索时将穷尽所有可能发生的步法。Alpha Go从本质上则是随着时间而学习的,可以识别出可能具有优势的模式,然后模拟出数量有限的潜在结果。 完成这个成就有多难? 东方的围棋被认为更加复杂,更加需要棋手难以置信的直觉。
国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。 就博弈的局面来讲,一般认为国际象棋为10的123乘方,而围棋则有10的360乘方以上。这导致软件来不及列举出所有能赢的方案,导致不敌职业棋手。 所以,在此前的比赛中,围棋AI一般和业余段位的棋手比赛,而且人类选手都会让子。但是&阿尔法围棋&的对手是法国国家围棋队教练、欧洲围棋冠军,而且没有让子。 阿尔法围棋是怎么做到的? DeepMind团队表示,&阿尔法围棋&的关键在于使用的深度神经网络。 在这样的网络中,如果你将足够多的关于树木的照片输入进去,它们就能学会识别出一棵树。如果输入足够多的对话,它们就能学会如何进行一段得体的对话。如果输入足够多的围棋走法,它们就能学会下围棋。 实际上,在&阿尔法围棋&中有两种不同的神经网络:&策略网络&(policy network)和&值网络&(value network)。 它们的任务在于合作&挑选&出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。 &阿尔法围棋&利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样&阿尔法围棋&在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。 也有许多专家相信,人类掌握围棋的秘诀在于模式识别&&通过棋子组成的图形形状来判断优势和弱点,而不是预测几步棋后的走向。 也正是因为这个原因,模式识别算法的最新进展有可能会大大改进计算机的表现。新算法利用大型的图片数据库,训练深度卷积神经网络(deep convolutional neural networks)来识别物体和面孔。这一网络借鉴了人脑的信息处理机制,与人脑的神经结构有相似之处。 因此,可以预想,这样的算法用在围棋棋局自动评估上,也能发挥巨大的作用。 根据研发者的介绍,这种神经网络可以自主学习,而非传统的对人工智能进行&监督训练&的算法。 此外,AI很容易通过大量的训练积累足够多的经验。人类或许一年可以下1000局围棋,但AI一天就能玩100万局,不会疲劳。 所以理论上来讲,只要&阿尔法围棋&经过足够的训练,就可以击败所有的人类选手。
李世石 今年3月,&阿尔法围棋&将挑战全球顶级的韩国九段棋手李世石,奖金是100万美元。李世石表示:&(人工智能)厉害得让人吃惊,听说一直在进化,不过我有信心取胜。& 微博网友表达了无奈的释然:&只要是存在规则的game,随着计算能力的提升和算法的优化,最终人类一定会败给电脑。 而人类的能力在于面对没有已知规则的困局,能够创造出路走出泥潭。& 人工智能一日千里 未来应用:语音识别、自动驾驶 相对于棋盘上的胜负,人工智能一日千里的进展更加激动人心。 《自然》杂志将&阿尔法围棋&的成果归功于&深度学习&(Deep Learning)。 深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。 2006年之后,深度学习实际使用多于三层的神经网络,即深度神经网络。这是复杂的非线性模型,拥有复杂的结构和大量的参数,有非常强的表示能力,特别适合于复杂的模式识别问题。 这种能力在&阿尔法围棋&身上就体现的很充分。另外,这一能力将能帮助人类在未来揭示丰富的信息,并对未来或未知事件做出更精准的预测。 这些能力也是自动驾驶的汽车、Siri 等语音识别技术以及(Facebook 最近获得的面部识别软件)的基础,越来越精准的翻译软件也归功于这样的AI技术。 谷歌高级工程师也还预测神经网络会在其他科学领域扮演重要工具,例如在基因行为预测,药物,蛋白质,新的医疗方案等。 果壳网写下了一段意味深长的评论:&AI一定会进入我们的生活,我们不可能躲开。这一接触虽然很可能悄无声息,但意义或许不亚于我们第一次接触外星生命。& 人工智能飞跃史 1950年,计算机科学先驱阿兰&图灵预测到2000年计算机就可以思考:拥有与人类同等水平的创造力、解决问题的能力、个性和适应性行为。他提出了一种判断机器能否进行思考的测试:图灵测试。 1956年,在达特茅斯会议上,一些研究者提出创造一个人工大脑,人工智能(AI)领域终于诞生。 在1980年代,&专家系统&的概念被计算机公司广泛应用,这是对于人工智能山野探索的开端。 1989年,卡内基梅隆大学研发了名为&Deep Thought&的专家系统,能够像大师一样下象棋。 1997年,IBM的计算机深蓝第一次击败了国际象棋大师卡斯帕罗夫。2006年,人类最后一次打败顶尖的国际象棋AI。 2005年,斯坦福大学延至的机器人赢得了美国Darpa大挑战,在这个美国国防高级研究计划局组织的自动驾驶汽车挑战中,它在荒漠赛道中行驶了131英里。 2011年,Watson 战胜了电视智力竞赛Jeopardy 的冠军。 来源:共同网、果壳网、独立报
凤凰网 官方微信微信扫描二维码DeepMind盯上《星际争霸》,人类又要被AI打脸了?_deepmind 星际
DeepMind盯上《星际争霸》,人类又要被AI打脸了?
责任编辑:deepmind 星际争霸 发表时间: 9:21:06
“想玩好星际,AI必须有效利用记忆,制定长远计划,并根据新信息调整计划。”还记得阿法狗(AlphaGo)吗?这个人工智能(AI)系统在人机大战中击败了韩国国手李世石。现在,该系统的缔造者DeepMind又盯上了下一个目标,它和围棋有着天壤之别。谷歌(Google)旗下的这家AI研究公司正在与游戏开发商暴雪(Blizzard)合作,准备挑战即时战略游戏《星际争霸2》。作为世界上最流行的电子竞技游戏之一,《星际争霸2》符合DeepMind想要展开有趣挑战的很多条件。不仅这款游戏的顶尖玩家能轻松地吊打最高难度的电脑机器人,而且该游戏还为DeepMind团队提供了新的探索领域。最重要的是,《星际争霸2》是一款充满了隐藏信息的游戏。每位玩家在地图的对角开始游戏,他们的任务是建造基地、发展科技、生产士兵和攻击对手,这些要素的平衡取舍都要依据对手的动向而定。但玩家只能看见单位周围的区域,地图的其他区域被隐藏在“迷雾”中。“玩家必须派遣单位侦察不可见的区域,以便获取对手信息,然后在很长时间内记住那些信息。”DeepMind在博客文章中写道,“这使得挑战变得更加复杂,因为地图只是部分可见,明显不同于完全信息博弈,比如象棋和围棋。这类即时战略游戏,双方玩家同时进行操作,因此必须迅速且有效地作出每个决定。”“想玩好星际,AI必须有效利用记忆,制定长远计划,并根据新信息调整计划。”但AI确实拥有一些先天优势。衡量星际玩家水平高低的一个指标是“手速”,实质上就是每分钟的操作次数(APM)。人工智能没有手指和肌肉,不会感到疲劳,因此APM自然能超过人类玩家,这可能导致人工智能不是胜在高明的战术,而只是胜在更快的反应。因此,DeepMind将把其人工智能系统限定在该公司研究员奥里奥尔?温亚尔斯(Oriol Vinyals)所说的“高水平人类”手速。这也有助于确保AI不是把处理能力用于暴力碾压级别的细节操作,而是专注于关键的战略判断。温亚尔斯在很早以前就和星际结缘。2010年,在加州大学伯克利分校读本科时,他开发了一种电脑机器人,玩《星际争霸1》的水平超过了游戏内置的所有电脑机器人。但那种机器人只是简单的脚本程序,它遵循的每条规则都是由人工制定,类似于阿法狗出现之前的AI围棋程序。和围棋一样,在《星际争霸2》中,DeepMind将专注于机器学习,设计一种能通过自学玩好这款游戏的AI。这次,该公司得到了星际争霸系列开发商暴雪的协助。那种帮助也将提供给其他想要展开同样挑战的AI研究者。在2017年第一季度,暴雪将更新《星际争霸2》,为该游戏引入新的AI研究环境,创建应用程序接口,让开发者可以从游戏中提取额外信息,用来教他们的AI系统玩这款游戏。DeepMind的最终目标,仍然是打造一种能像人类那样玩星际的AI,一种只是看着屏幕图像、通过键盘和鼠标来操纵单位的电脑系统。但就短期而言,DeepMind用简化视图来训练其系统要更加容易得多。简化视图提供常规地图和迷你地图的低分辨率图像,并把特征分解到不同的层,明确显示出地形高度、单位类型和血量等细节。DeepMind和暴雪的合作是双向的。暴雪希望利用相关发现来改善自己的游戏。“AI能否玩得更好,甚至根据玩家的操作做出相应调整?”暴雪《星际争霸2》首席制作人克里斯?西加提(Chris Sigaty)说,“我们能否像教AI那样教玩家?关于AI对我们意味着什么的问题,还存在很多猜测,但我们敢肯定它将帮助我们改善这款游戏。”但这样做的目标不只是改善游戏。温亚尔斯说,DeepMind的终极目标是利用AI解决现实问题,而《星际争霸2》是朝这个目标迈进的下一步。完全信息的缺乏,写实(一定程度上的“写实”)的画面,对记忆力甚至某种想象力的要求,这些都对AI理解现实世界非常重要。他说,游戏比现实世界更容易帮助AI理解现实世界。“你可以快速地运行游戏,有明确的得分或胜负。我们也能从这款游戏中获得很多启示,而展开同样挑战的其他人可以改进我们的研究。”DeepMind把注意力转向围棋的时候,该公司在一年内就击败了当时最出色的AI围棋程序,在两年内战胜了最优秀的人类棋手。但温亚尔斯和西加提都不愿预测AI征服《星际争霸2》需要多长时间。“从科研的角度来看,我们也许取得了很大进展,但对于我们能否打败最强玩家的问题,我觉得现在下结论还为时尚早。”温亚尔斯说。翻译:于波来源:The Guardian造就:剧院式的线下演讲平台,发现最有创造力的思想更多精彩内容及免费演讲门票,敬请关注:造就
上一集:没有了 下一集:
相关文章:&&&&&&&&
最新添加资讯
24小时热门资讯
附近好友搜索学会了围棋后谷歌DeepMind的AI又开始玩游戏了
扫描到手机,看更多国搜资讯
您可以用手机或平板电脑的二维码应用拍下左侧二维码,您可以在手机国搜客户端继续浏览本文,并可以分享给你的好友。
核心提示:今天,谷歌DeepMind实验室宣布它们开始了新的实验,其中包括在游戏中训练一只蚂蚁将球射进球门。是不是觉得这比下围棋简单多了?其实不然, 亚马逊 、 苹果 、 Facebook 和 微软 都正在该领域进行着相关研究。
腾讯科技讯 6月18日,据科技博客VentureBeat报道,提到 谷歌 (微博) 的DeepMind人工智能,大家首先想到的一定是击败韩国棋手李世石的AlphaGo,不过后来它又学了走迷宫等新招数,现在AlphaGo又开始了自己新的征程。
今天,谷歌DeepMind实验室宣布它们开始了新的实验,其中包括在游戏中训练一只蚂蚁将球射进球门。是不是觉得这比下围棋简单多了?其实不然, 亚马逊 、 苹果 、 Facebook 和 微软 都正在该领域进行着相关研究。
“我们还打造了一个分布式的大型深度强化学习(reinforcement learning)系统并将其命名为Gorila,该系统利用Google Cloud平台大幅提高了训练效率,眼下该系统已经开始为谷歌的个性化推荐系统服务。”谷歌DeepMind实验室的席尔瓦在博客中写道。
强化学习涉及我们熟悉的试错学习项目,DeepMind实验室将其与深度学习相结合,以便获得更强的推理能力。
在博客中,席尔瓦还提到了许多DeepMind实验室的研究项目。
“为了解决连续控制问题,如机器人操作和运动,我们还专门开发了许多深度强化学习方法,这些方法可以很好的解决蚂蚁踢球等问题。”席尔瓦说道。未来几个月内,DeepMind实验室还将发布开源的迷宫软件。
责任编辑:肖龙飞
6月21日起,农业路南阳路至嵩山路段下穿铁路涵洞段将逐步封闭围挡施工,未来两年内,这一路段最窄时将仅保留东西双向单车道通行。在此期间,京广快速路在农业路路口处的上下桥匝道也将同时关闭。
高考落幕,专业、职业乃至人生规划摆在考生面前。在“中国父母最希望子女进入行业”的排行榜上,投资银行占据榜首。
“两天联系不上了!他究竟去了哪里?”小伟(化名)和大林(化名)是好朋友,不经意间,小伟发现联系不上大林了,一开始并未发现异常,可能只是在忙而已。
“16路公交车上的收费员不断地将游客骗到天涯海角第二站,然后用电瓶车将其骗到村里消费”,16日,微博网友“@热腾腾的化肥”的爆料引发多名网友关注。
免责声明:
凡发布在本网上的内容,除标注为“中国搜索”或“国搜”的稿件外,其他均转自第三方网站,是为传递更多信息和学习之目的,不意味着本网认可其观点或证实其内容的真实性、准确性。如有意见建议,请点击页面下方的“对国搜说”,欢迎及时反馈。
版权说明:
凡来源标注为“中国搜索”的本网稿件,转载时请注明出处。
科技热搜词
黄金周哪些景点最受欢迎,会不会被挤成饼干?
扫码关注中国搜索官方微信
扫码关注中国搜索官方微信}

我要回帖

更多关于 星际2子弹打不完 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信