下完围棋大全完整版打星际为什么DeepMind的AI机器人那么爱玩

点击联系发帖人 时间：2017-05-28 09:53

星际2子弹打不完

您所在的位置：
学会了围棋后谷歌DeepMind的AI又开始玩游戏了
11:53:57 &&&&来源： itwriter
　　6 月 18 日，据科技博客 VentureBeat 报道，提到谷歌的 DeepMind 人工智能，大家首先想到的一定是击败韩国棋手李世石的 AlphaGo，不过后来它又学（本文来自：湖北+招考网）了走迷宫等新招数，现在 AlphaGo 又开始了自己新的征程。
　　今天，谷歌 DeepMind 实验室宣布它们开始了新的实验，其中包括在游戏中训练一只（本文来自：湖北考试网e&d&）蚂蚁将球射进球门。是不是觉得这比下围棋简单多了？其实不然，亚马逊、苹果、Facebook 和微软都正在该领域进行着相关研究。
　　&我们还打造了一个分布式的大型深度强化学习（reinforcement learning）系统并将其命名为 Gorila，该系统利用 Google Cloud 平台大幅提高了训练效率，眼下（本文来源：湖北考试网/）该系统已经开始为谷歌的个性化推荐系统服务。&谷歌 DeepMind 实验室的席尔瓦在博客中写道。
　　强化学习涉及我们熟悉的试错学习项目，DeepMind 实验室将其与深度学习相结合，以便获得更强的推理能力。
　　在博客中，席尔瓦还提到了许多 DeepMind 实验室的研究项目。（本文来自：湖北www.考试网）
　　&为了解决连续控制问题，如机器人操作和运动，我们还专门开发了许多深度强化学习方法，这些方法可以很好的解决蚂蚁踢球等问题。&席尔瓦说道。未来几个月内，DeepMind 实验室还将发布开源的迷宫软件。
[责任编辑：Admin]
【&&】【】
加入收藏 | 旗下：
Copyright &
All Rights Reserved
站务：广告：邮箱：（娱乐类除外）
分流站&湖北唯一PR8的教育门户谷歌围棋程序击败欧洲冠军人工智能重大飞跃！_凤凰资讯
凤凰资讯出品
谷歌围棋程序击败欧洲冠军人工智能重大飞跃！
作者：边驿卒第272期
《自然》杂志27日发文，围棋电脑软件“AlphaGo”(阿尔法围棋)打败了职业棋手。这个软件由谷歌旗下的人工智能（AI）开发商“DeepMind”所研发。机器人闯进了围棋界？
机器人闯进了围棋界？《自然》杂志27日发文，围棋电脑软件&AlphaGo&(以下称&阿尔法围棋&)打败了职业棋手，震撼了国际棋坛。这个软件由谷歌旗下的人工智能（AI）开发商&DeepMind&所研发，所以这个消息也令人工智能科学家们感到震撼。
自然杂志封面这款名为&阿尔法围棋&的人工智能，在没有任何让子的情况下以5:0完胜欧洲冠军，职业围棋二段樊麾。你可能想到了1997年计算机程序&深蓝&和国际象棋大师卡斯帕罗夫的世纪之战。在那次比赛中，卡斯帕罗夫输给了这个IBM开发的计算机程序。这是人工智能历史上的划时代事件。而这次比赛的意义毫不逊色。 1997年，当IBM深蓝计算机在象棋上称霸时，它使用的是手工编码的规则，在搜索时将穷尽所有可能发生的步法。Alpha Go从本质上则是随着时间而学习的，可以识别出可能具有优势的模式，然后模拟出数量有限的潜在结果。完成这个成就有多难？东方的围棋被认为更加复杂，更加需要棋手难以置信的直觉。
国际象棋中，平均每回合有35种可能，一盘棋可以有80回合；相比之下，围棋每回合有250种可能，一盘棋可以长达150回合。就博弈的局面来讲，一般认为国际象棋为10的123乘方，而围棋则有10的360乘方以上。这导致软件来不及列举出所有能赢的方案，导致不敌职业棋手。所以，在此前的比赛中，围棋AI一般和业余段位的棋手比赛，而且人类选手都会让子。但是&阿尔法围棋&的对手是法国国家围棋队教练、欧洲围棋冠军，而且没有让子。阿尔法围棋是怎么做到的？ DeepMind团队表示，&阿尔法围棋&的关键在于使用的深度神经网络。在这样的网络中，如果你将足够多的关于树木的照片输入进去，它们就能学会识别出一棵树。如果输入足够多的对话，它们就能学会如何进行一段得体的对话。如果输入足够多的围棋走法，它们就能学会下围棋。实际上，在&阿尔法围棋&中有两种不同的神经网络：&策略网络&（policy network）和&值网络&（value network）。它们的任务在于合作&挑选&出那些比较有前途的棋步，抛弃明显的差棋，从而将计算量控制在计算机可以完成的范围里，本质上和人类棋手所做的一样。 &阿尔法围棋&利用这两个工具来分析局面，判断每种下子策略的优劣，就像人类棋手会判断当前局面以及推断未来的局面一样。这样&阿尔法围棋&在分析了比如未来20步的情况下，就能判断在哪里下子赢的概率会高。也有许多专家相信，人类掌握围棋的秘诀在于模式识别&&通过棋子组成的图形形状来判断优势和弱点，而不是预测几步棋后的走向。也正是因为这个原因，模式识别算法的最新进展有可能会大大改进计算机的表现。新算法利用大型的图片数据库，训练深度卷积神经网络（deep convolutional neural networks）来识别物体和面孔。这一网络借鉴了人脑的信息处理机制，与人脑的神经结构有相似之处。因此，可以预想，这样的算法用在围棋棋局自动评估上，也能发挥巨大的作用。根据研发者的介绍，这种神经网络可以自主学习，而非传统的对人工智能进行&监督训练&的算法。此外，AI很容易通过大量的训练积累足够多的经验。人类或许一年可以下1000局围棋，但AI一天就能玩100万局，不会疲劳。所以理论上来讲，只要&阿尔法围棋&经过足够的训练，就可以击败所有的人类选手。
李世石今年3月，&阿尔法围棋&将挑战全球顶级的韩国九段棋手李世石，奖金是100万美元。李世石表示：&（人工智能）厉害得让人吃惊，听说一直在进化，不过我有信心取胜。& 微博网友表达了无奈的释然：&只要是存在规则的game，随着计算能力的提升和算法的优化，最终人类一定会败给电脑。而人类的能力在于面对没有已知规则的困局，能够创造出路走出泥潭。& 人工智能一日千里未来应用：语音识别、自动驾驶相对于棋盘上的胜负，人工智能一日千里的进展更加激动人心。《自然》杂志将&阿尔法围棋&的成果归功于&深度学习&（Deep Learning）。深度学习是目前人工智能领域中最热门的科目，它能完成笔迹识别，面部识别，驾驶自动，自然语言处理，识别声音，分析生物信息数据等非常复杂的任务。 2006年之后，深度学习实际使用多于三层的神经网络，即深度神经网络。这是复杂的非线性模型，拥有复杂的结构和大量的参数，有非常强的表示能力，特别适合于复杂的模式识别问题。这种能力在&阿尔法围棋&身上就体现的很充分。另外，这一能力将能帮助人类在未来揭示丰富的信息，并对未来或未知事件做出更精准的预测。这些能力也是自动驾驶的汽车、Siri 等语音识别技术以及（Facebook 最近获得的面部识别软件）的基础，越来越精准的翻译软件也归功于这样的AI技术。谷歌高级工程师也还预测神经网络会在其他科学领域扮演重要工具，例如在基因行为预测，药物，蛋白质，新的医疗方案等。果壳网写下了一段意味深长的评论：&AI一定会进入我们的生活，我们不可能躲开。这一接触虽然很可能悄无声息，但意义或许不亚于我们第一次接触外星生命。& 人工智能飞跃史 1950年，计算机科学先驱阿兰&图灵预测到2000年计算机就可以思考：拥有与人类同等水平的创造力、解决问题的能力、个性和适应性行为。他提出了一种判断机器能否进行思考的测试：图灵测试。 1956年，在达特茅斯会议上，一些研究者提出创造一个人工大脑，人工智能（AI）领域终于诞生。在1980年代，&专家系统&的概念被计算机公司广泛应用，这是对于人工智能山野探索的开端。 1989年，卡内基梅隆大学研发了名为&Deep Thought&的专家系统，能够像大师一样下象棋。 1997年，IBM的计算机深蓝第一次击败了国际象棋大师卡斯帕罗夫。2006年，人类最后一次打败顶尖的国际象棋AI。 2005年，斯坦福大学延至的机器人赢得了美国Darpa大挑战，在这个美国国防高级研究计划局组织的自动驾驶汽车挑战中，它在荒漠赛道中行驶了131英里。 2011年，Watson 战胜了电视智力竞赛Jeopardy 的冠军。来源：共同网、果壳网、独立报
凤凰网官方微信微信扫描二维码DeepMind盯上《星际争霸》，人类又要被AI打脸了？_deepmind 星际
DeepMind盯上《星际争霸》，人类又要被AI打脸了？
责任编辑：deepmind 星际争霸发表时间： 9:21:06
“想玩好星际，AI必须有效利用记忆，制定长远计划，并根据新信息调整计划。”还记得阿法狗（AlphaGo）吗？这个人工智能（AI）系统在人机大战中击败了韩国国手李世石。现在，该系统的缔造者DeepMind又盯上了下一个目标，它和围棋有着天壤之别。谷歌（Google）旗下的这家AI研究公司正在与游戏开发商暴雪（Blizzard）合作，准备挑战即时战略游戏《星际争霸2》。作为世界上最流行的电子竞技游戏之一，《星际争霸2》符合DeepMind想要展开有趣挑战的很多条件。不仅这款游戏的顶尖玩家能轻松地吊打最高难度的电脑机器人，而且该游戏还为DeepMind团队提供了新的探索领域。最重要的是，《星际争霸2》是一款充满了隐藏信息的游戏。每位玩家在地图的对角开始游戏，他们的任务是建造基地、发展科技、生产士兵和攻击对手，这些要素的平衡取舍都要依据对手的动向而定。但玩家只能看见单位周围的区域，地图的其他区域被隐藏在“迷雾”中。“玩家必须派遣单位侦察不可见的区域，以便获取对手信息，然后在很长时间内记住那些信息。”DeepMind在博客文章中写道，“这使得挑战变得更加复杂，因为地图只是部分可见，明显不同于完全信息博弈，比如象棋和围棋。这类即时战略游戏，双方玩家同时进行操作，因此必须迅速且有效地作出每个决定。”“想玩好星际，AI必须有效利用记忆，制定长远计划，并根据新信息调整计划。”但AI确实拥有一些先天优势。衡量星际玩家水平高低的一个指标是“手速”，实质上就是每分钟的操作次数（APM）。人工智能没有手指和肌肉，不会感到疲劳，因此APM自然能超过人类玩家，这可能导致人工智能不是胜在高明的战术，而只是胜在更快的反应。因此，DeepMind将把其人工智能系统限定在该公司研究员奥里奥尔?温亚尔斯（Oriol Vinyals）所说的“高水平人类”手速。这也有助于确保AI不是把处理能力用于暴力碾压级别的细节操作，而是专注于关键的战略判断。温亚尔斯在很早以前就和星际结缘。2010年，在加州大学伯克利分校读本科时，他开发了一种电脑机器人，玩《星际争霸1》的水平超过了游戏内置的所有电脑机器人。但那种机器人只是简单的脚本程序，它遵循的每条规则都是由人工制定，类似于阿法狗出现之前的AI围棋程序。和围棋一样，在《星际争霸2》中，DeepMind将专注于机器学习，设计一种能通过自学玩好这款游戏的AI。这次，该公司得到了星际争霸系列开发商暴雪的协助。那种帮助也将提供给其他想要展开同样挑战的AI研究者。在2017年第一季度，暴雪将更新《星际争霸2》，为该游戏引入新的AI研究环境，创建应用程序接口，让开发者可以从游戏中提取额外信息，用来教他们的AI系统玩这款游戏。DeepMind的最终目标，仍然是打造一种能像人类那样玩星际的AI，一种只是看着屏幕图像、通过键盘和鼠标来操纵单位的电脑系统。但就短期而言，DeepMind用简化视图来训练其系统要更加容易得多。简化视图提供常规地图和迷你地图的低分辨率图像，并把特征分解到不同的层，明确显示出地形高度、单位类型和血量等细节。DeepMind和暴雪的合作是双向的。暴雪希望利用相关发现来改善自己的游戏。“AI能否玩得更好，甚至根据玩家的操作做出相应调整？”暴雪《星际争霸2》首席制作人克里斯?西加提（Chris Sigaty）说，“我们能否像教AI那样教玩家？关于AI对我们意味着什么的问题，还存在很多猜测，但我们敢肯定它将帮助我们改善这款游戏。”但这样做的目标不只是改善游戏。温亚尔斯说，DeepMind的终极目标是利用AI解决现实问题，而《星际争霸2》是朝这个目标迈进的下一步。完全信息的缺乏，写实（一定程度上的“写实”）的画面，对记忆力甚至某种想象力的要求，这些都对AI理解现实世界非常重要。他说，游戏比现实世界更容易帮助AI理解现实世界。“你可以快速地运行游戏，有明确的得分或胜负。我们也能从这款游戏中获得很多启示，而展开同样挑战的其他人可以改进我们的研究。”DeepMind把注意力转向围棋的时候，该公司在一年内就击败了当时最出色的AI围棋程序，在两年内战胜了最优秀的人类棋手。但温亚尔斯和西加提都不愿预测AI征服《星际争霸2》需要多长时间。“从科研的角度来看，我们也许取得了很大进展，但对于我们能否打败最强玩家的问题，我觉得现在下结论还为时尚早。”温亚尔斯说。翻译：于波来源：The Guardian造就：剧院式的线下演讲平台，发现最有创造力的思想更多精彩内容及免费演讲门票，敬请关注：造就
上一集:没有了下一集:
相关文章：&&&&&&&&
最新添加资讯
24小时热门资讯
附近好友搜索学会了围棋后谷歌DeepMind的AI又开始玩游戏了
扫描到手机，看更多国搜资讯
您可以用手机或平板电脑的二维码应用拍下左侧二维码，您可以在手机国搜客户端继续浏览本文，并可以分享给你的好友。
核心提示：今天，谷歌DeepMind实验室宣布它们开始了新的实验，其中包括在游戏中训练一只蚂蚁将球射进球门。是不是觉得这比下围棋简单多了？其实不然，亚马逊、苹果、 Facebook 和微软都正在该领域进行着相关研究。
腾讯科技讯 6月18日，据科技博客VentureBeat报道，提到谷歌 (微博) 的DeepMind人工智能，大家首先想到的一定是击败韩国棋手李世石的AlphaGo，不过后来它又学了走迷宫等新招数，现在AlphaGo又开始了自己新的征程。
今天，谷歌DeepMind实验室宣布它们开始了新的实验，其中包括在游戏中训练一只蚂蚁将球射进球门。是不是觉得这比下围棋简单多了？其实不然，亚马逊、苹果、 Facebook 和微软都正在该领域进行着相关研究。
“我们还打造了一个分布式的大型深度强化学习（reinforcement learning）系统并将其命名为Gorila，该系统利用Google Cloud平台大幅提高了训练效率，眼下该系统已经开始为谷歌的个性化推荐系统服务。”谷歌DeepMind实验室的席尔瓦在博客中写道。
强化学习涉及我们熟悉的试错学习项目，DeepMind实验室将其与深度学习相结合，以便获得更强的推理能力。
在博客中，席尔瓦还提到了许多DeepMind实验室的研究项目。
“为了解决连续控制问题，如机器人操作和运动，我们还专门开发了许多深度强化学习方法，这些方法可以很好的解决蚂蚁踢球等问题。”席尔瓦说道。未来几个月内，DeepMind实验室还将发布开源的迷宫软件。
责任编辑：肖龙飞
6月21日起，农业路南阳路至嵩山路段下穿铁路涵洞段将逐步封闭围挡施工，未来两年内，这一路段最窄时将仅保留东西双向单车道通行。在此期间，京广快速路在农业路路口处的上下桥匝道也将同时关闭。
高考落幕，专业、职业乃至人生规划摆在考生面前。在“中国父母最希望子女进入行业”的排行榜上，投资银行占据榜首。
“两天联系不上了！他究竟去了哪里？”小伟（化名）和大林（化名）是好朋友，不经意间，小伟发现联系不上大林了，一开始并未发现异常，可能只是在忙而已。
“16路公交车上的收费员不断地将游客骗到天涯海角第二站，然后用电瓶车将其骗到村里消费”，16日，微博网友“@热腾腾的化肥”的爆料引发多名网友关注。
免责声明：
凡发布在本网上的内容，除标注为“中国搜索”或“国搜”的稿件外，其他均转自第三方网站，是为传递更多信息和学习之目的，不意味着本网认可其观点或证实其内容的真实性、准确性。如有意见建议，请点击页面下方的“对国搜说”，欢迎及时反馈。
版权说明：
凡来源标注为“中国搜索”的本网稿件，转载时请注明出处。
科技热搜词
黄金周哪些景点最受欢迎，会不会被挤成饼干？
扫码关注中国搜索官方微信
扫码关注中国搜索官方微信}

叫阿莫西中心