从阿尔法狗看人工智能能通杀任何棋类吗

点击联系发帖人 时间：2017-12-11 12:02

阿尔法狗与人工智能

阿尔法狗再进化！“通用棋类AI”AlphaZero问世
　　【环球智能12月7日报道记者心月】就在今年10月份，谷歌旗下的创业公司DeepMind发布了AlphaGo Zero。没错，就是之前接连打败围棋世界冠军，李世石九段和柯洁九段的那个阿尔法狗的终极进化版。阿尔法狗项目首席研究员大卫&席尔瓦曾表示，AlphaGo Zero是目前世界上最强大的围棋程序，超越以往所有阿尔法狗的旧版本。
　　然而日前，DeepMind 悄悄放出了一篇新论文，介绍了一个AlphaZero。一开始我们差点以为 DeepMind 也学会炒冷饭了，毕竟AlphaGo Zero&在10 月就发出来了。可仔细一看，这次的 AlphaZero 不是以前那个只会下围棋的人工智能了，它是通用的，国际象棋、日本象棋也会下，所以去掉了名字里表示围棋的&Go&。
　　据了解，AlphaZero算法可以在8个小时训练击败李世石版本AlphaGo;再用4小时训练击败世界顶级的国际象棋程序S再用2小时训练击败世界顶级将棋程序Elmo。这是DeepMind团队继AlphaGo Zero的研究问世之后，带给我们的又一全新算法，它是&更通用的版本&。
　　我们可以看到AlphaZero与AlphaGo Zero有几点不同，首先AlphaGo Zero是在假设结果为赢/输二元的情况下，对获胜概率进行估计和优化。而AlphaZero会将平局或其他潜在结果纳入考虑，对结果进行估计和优化。其次，AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强，而AlphaZero不会。另外，AlphaZero只维护单一的一个神经网络，这个神经网络不断更新，而不是等待迭代。AlphaZero中，所有对弈都重复使用相同的超参数，因此无需进行针对特定某种游戏的调整。
　　AlphaZero 的问世是算法和计算资源的胜利，更是人类的顶尖研究成果。DeepMind 愿景中能解决各种问题的通用 AI，离我们是越来越近了。
责编：梁爽
版权作品，未经环球网书面授权，严禁转载，违者将被追究法律责任。
环球时报系产品
扫描关注环球网官方微信
扫描关注这里是美国微信公众号
扫描关注更多环球微信公众号赢得过围棋冠军，“阿尔法狗”能打败电竞选手吗?
稿源：刘娈的网站
3 月9日，万众瞩目的人机大战AlphaGo(以下称&阿尔法狗&)与李世石之间的围棋对决正式打响。这次比赛，李世石作为韩国冠军选手，身上可谓是背负天下厚望。因早前人工智能&阿尔法狗&完胜欧洲围棋冠军樊麾令人类颜面尽失,所以这一次所有人都将希望李世石能够战胜&阿尔法狗&为人类争光。
这几天，整个社会对这场人机大战尤为关注，不仅有各大媒体不断报导，就连各大电视台也正不断轮播放这场世纪大战。截止至目前，&阿尔法狗&与李世石已经大战四个回合，前三局李世石被&阿尔法狗&击败，第四局李世石胜出，但这场胜利似乎已经来迟。在前三局中，李世石无论是执黑还是执白，均被&阿尔法狗&打得毫无还手之力，因此这场大战尚未结束人们心中便已经有了一个明确的答案，在围棋这一高大上、文化历史悠久的项目上，人类正式败给了人工智能。
长久以来许多人都认为围棋是人类智慧的精华，如今人类在围棋这一项目上输给人工智能，某种意义上而言也就意味人类已经彻底输给机器，但社会中那些电子竞技游戏玩家却不服了，因此社会中关于&阿尔法狗&能否打败电竞游戏选手的探讨油然而生。那么&阿尔法狗&究竟在电子竞技这一项目上能够打败人类吗?大伙不妨一起来思考一下。
&阿尔法狗&的工作原理
&阿尔法狗&由位于英国伦敦的谷歌旗下 DeepMind公司开发。据DeepMind的团队介绍，之所以&阿尔法狗&可以玩转围棋，是因为它具有两个大脑，一个叫做&策略网络&，负责选择下一步走法;另一个&价值网络&，负责预测比赛胜利者，每走一步估算一次获胜方，而不是一直搜索到比赛结束，从而减少了运算量。两个大脑配合工作，于是将围棋巨大无比的搜索空间压缩到可以控制的范围之内。
正是在拥有这种超强的学习能力的情况下，AlphaGo才能够在战胜职业二段樊麾5个月之后，就可以挑战人类顶尖棋手并&战而胜之&。
可即便是如此，&阿尔法狗&同样也存在自己的缺陷，那便是它只能玩特定的套路。&阿尔法狗&自身建立神经网络的基本流程是，首先搜集大量数据样本，然后选择合适模型，让模型学习样本，从中找出数据的内在规律。当前人工智能的一个技术瓶颈，就是解决问题前先要获取大量高质量数据样本，而人类在学习新事物时往往只需很少的样本。&这就导致问题稍微变化，机器就不行了。例如换成25路棋盘，李世石仍能战，&阿尔法围棋&就不行了，需要回去重新收集25路棋盘上的棋谱，重新训练模型，&南京大学计算机科学与技术系周志华说。
人工智能是否能打败电竞选手?
&阿尔法狗&能够打败电竞游戏选手?现阶段而言这个可能新不大，随着科技的发展，以后或许能够实现。因为目前人工智能的思考方式要通过人类授予，而诸如《英雄联盟》、《星际争霸》此类电竞游戏其实玩家自己都没弄懂游戏的套路，所以没法交给人工智能一种理性的获胜方式。
以《英雄联盟》举例，在面对游戏里的每一种局面，没有人能够准确的判断出局面的最优解。如果能计算出局面最优解，那么人工智能凭借准确无失误的完美操作，肯定可以胜过人类。然而玩家自己本身对《英雄联盟》里所谓的&战术&都还尚且是一知半解，远没有达到人类对围棋游戏的理解深度。毕竟围棋游戏已经经历了数百年来的细心钻研，并且经验是不断传承的。而电子游戏时常更新，更新等于改变了规则，而改变规则会给经验传承带来极大困难。
所以要想制造出完胜人类的&阿尔法狗&，我们首先要总结出电竞游戏的理性获胜方式，可这个现阶段而言暂时不在人类的能力范围内。因此至少需要等到人类自己把这个游戏玩的差不多明白套路之后，才有能力创造这样的&阿尔法狗&人工智能机器人。
文章：67篇人气：27958
没有花边，也没有哗众取宠，有的只是我对IT产业的观察和思考。
本网页浏览已超过3分钟，点击关闭或灰色背景，即可回到网页阿尔法狗的自对弈50局棋谱已现，我们该如何学习？
阿尔法狗的自对弈50局棋谱已现，我们该如何学习？
昨晚手机被阿尔法狗的自战棋局刷屏了，大家一看棋谱的内容后，既兴奋，又觉得有点不可思议，世界冠军时越就说：“这是来自未来的棋谱”！阿尔法狗的团队宣布将要公开阿尔法狗自对弈的50盘棋谱，这个消息对我们围棋界来说真是天大的好事！有点像当年王重阳走后留下了一部九阴真经，而且还是网络公开版的。接下来，各路武林豪杰肯定会好好地去研究这本武林秘籍！我看网上有人说：“机器的招法是基于深度计算而得来的，人类去学习，这不是东施效颦吗？”我觉得这个说法说对了一半，的确，有很多招法是机器经过大数据计算而得来的结果，没有像它那样强大的计算能力，我们将无法做到和效仿；但为什么我们要去效仿呢？机器还有很多好的招法在我看来，其实是不需要依赖深度计算的，而是凭感觉就能得来的，只不过我们的感觉被自己过去的经验所禁锢和束缚了。其实这次阿尔法狗已经告诉我们，围棋的开局下哪里都可以，其好坏优劣是相对而不是绝对的，关键是看之后的运用。阿尔法狗已经够强了，但从它在布局上的招法来看，它也在不断创新尝试。就像开局点三三，局部下完后，谁好？阿尔法狗也不知道，但它在点完三三之后对子效利弊的理解和运用上比我们高出一筹，所以它无论是点的一方还是被点的一方，都能赢。开局点三三这个局部一下完，就像一个刚出生的婴儿，他与生俱来的性格是没有绝对好坏的，决定他未来成长的是取决于家长如何去引导他发挥性格中好的一面。从这里就可以看出，围棋是活的。所以我们拿到阿尔法狗50盘对局这本武林秘籍后，可以学习，但不要盲目模仿，一旦盲目模仿，你又会陷入到一个新的思想禁锢之中。就连阿尔法狗都在不断创新尝试，而有着心灵能动性的我们，怎么能思想禁锢不前呢？再强的招法，它只是招式，就像武侠小说中说的一样，最后你是要忘掉招式的。所以我们学习这本武林秘籍，学习什么？我觉得，在认真学习阿尔法狗的招法后，你忘掉的的东西就是你真正学到的东西！我们要学的不是具体的招法，而是招法背后所包含的逻辑和意境。如果一味沉迷于招法本身，那你很可能将被阿尔法狗禁锢了自己的思想。我希望看到的是，一年后，阿尔法狗对局中的招法已经被人类棋手再次创新，而不是模仿。这次人机大战第二局，柯洁已经把阿尔法狗带到了悬崖边，可惜由于自己的失误而错过了考验阿尔法狗的机会。有人说：“从阿尔法狗自对弈的棋谱中看，它全盘作战能力非常强，那看来，柯洁第二盘就算下对了，考验了阿尔法狗，估计也没啥大用了。”我对此到是有我的看法：首先，阿尔法狗的棋谱是它自对弈的棋，是机器与机器下的棋，这与跟人下还是有区别的；其次，对阿尔法狗来说，在死活对杀这种相对简单的事情上，可能它并不是最擅长的，出错的概率就会增加，而且就是因为简单，所以它一旦出错，我们是可以抓住的。而那些对我们来说相对模糊说不清的地方（需要基于全局的大数据计算），它比我们厉害多了！所以这种地方就算它出错了，你也抓不住，甚至都不知道它哪里出错了。如果时光倒流回到第二局中盘128手前的那一刻，我还是很想看到让阿尔法狗考试的场面，也许试了还是不行，但不试，又怎么能知道呢？棋友们，阿尔法狗将要公布50局自对弈棋谱，你们觉得学习这些棋谱有用还是没用？有用的话，应该怎么去学习？欢迎在评论区说一说吧？本文来自微信号：“耀宇围棋”，作者胡耀宇。弈客围棋原创整理更多精彩赛事直播，棋文弈事，尽在弈客围棋，下载弈客APP，和热爱围棋的棋友对弈手谈！
本文仅代表作者观点，不代表百度立场。系作者授权百家号发表，未经许可不得转载。
百家号最近更新：
简介: 最纯粹的足球，最精彩的比赛
作者最新文章阿尔法狗，它的每一手棋都是冰冷的-ZAKER新闻
看阿尔法狗的棋，顶多可以揣摩它对当下的棋局形势判断，是紧张还是平稳，真的完全感觉不到 " 心情 " 这回事——抑或是我们主动关闭了这种感受？好像还真不是。我们作为旁观者也能清清楚楚感觉得到，它的每一手棋都是冷冰冰的。2016 年 3 月 12 日，阿尔法狗与李世石下到 3:0。全世界的棋手只能接受这个事实：人类已经无法在棋盘上战胜人工智能。2017 年 5 月，柯洁来到乌镇，棋迷的期待再次点燃。至于最后的结果，已经没有人会感到意外。不管怎么说，阿尔法狗让全世界更多的人知道围棋，让棋迷前所未有地领悟围棋的 " 深奥幽玄 "，让棋手加深对围棋的理解，善莫大焉。反正，对于棋手和棋迷来说，震撼和遗憾很快会过去。阿尔法狗的胜绩，改变不了他们对围棋的热爱。第二次人机大战，我们学到一个新名词：剪枝。没错，它本来是个园艺活。拿一把剪刀，剪掉一些枝丫，就像给花木理发，让它长得更好。用它来描述思维方式，大致就是排除一些不必要的搜索和计算，让问题简单化。据说，阿尔法狗之所以会在双方边界已经确定的地方先手补棋，彻底排除出现变化的可能性，就是为了此后再也不必考虑这里的应对，可以减少计算量。而人类棋手用不着这样，因为我们会自动屏蔽掉这里的计算，根本就不予考虑。初看起来，阿尔法狗这种下法有些笨拙。人类棋手会把这些棋留到收官阶段，下完它们，只是为了便于数子——如果最后不是中盘胜负，需要数子的话。再说，这样的下法，相当于先行放弃了一些劫材，用不懂棋的人也能懂的话来说，相当于放弃了一些在必要的时候，可以用来讨价还价的筹码。总而言之，要是学棋的人下出这样的棋，一定会被老师骂的。不要说这些不必要的补棋，就是在正常交锋的场合，阿尔法狗的一些下法，也常常让人类棋手大呼看不懂。说它们莫名其妙，那算是客气的。要是人类下出这样的棋，多半会被说成臭棋、俗手，或者，也不跟你讲什么道理，总之就说这棋下得难看，形状不好，味道怪怪的，诸如此类。所以，但凡正儿八经学过一点棋的人，基本上不会下出这样的棋，因为它们早就已经在从小到大不计其数的练习和实战中屏蔽掉了。然而，问题来了。阿尔法狗的剪枝，它的根据是逐个计算、排除。而屏蔽的根据是经验和规律。这个区别太大了。经过两次人机大战，阿尔法狗给人类的最大教训，也许没有之一，就是原来认为不能下或不必下的棋，也是可以下的，而且有可能直接成为妙手，或者为后面的妙手作准备。人类棋手屏蔽了一些下法，固然大大减少了计算量，但是也不由分说地排除了所有这些可能性。而阿尔法狗恰恰因为它的 " 笨拙 "，也因为从来没有人告诉它，哪些下法是可以考虑，哪些下法是应该不予考虑的，它只能把各个可能落子的点都挨个儿计算过来。这样一来，倒是有可能找出人类从来未曾想到过的妙手。所以，好像也没有必要夸大这些妙手有多么神奇，对于阿尔法狗来说，无非就是遵照最基本的围棋规则和计算方法，经过对比，筛选出了那一手棋。实际上，人类棋手也时不时会下出这样的妙手，好像比较常见的是处于劣势的一方，为了败中求胜，冒险尝试一些不常用的、甚至从来没人下过的下法，结果，石破天惊。如果非要说这些妙手有多么神奇，倒不如说它们显示的是围棋的神秘莫测，奇妙无穷。然而，又来了另一个问题。像阿尔法狗那样，把所有的下法、应对、结果全部算好，再来作出抉择，是不是也有点无趣？甚至，我们不禁要问，那还叫抉择吗？甚而至于，在每一手棋落子之前，已经把全部可能性都计算清楚了，还有必要下棋吗？人生之所以还值得一过，理由之一，正在于时不时的有意外的惊喜或遭遇，或者主动去探究未知领域。山重水复疑无路，柳暗花明又一村。要的就是这种豁然开朗的效果。如果在出门之前就已经预定所有细节，如果所有的体验都跟预期的一样，那还有必要旅行吗？就算知道未来的岁月会越来越好，那又怎么样呢？总会有人想要算命、占卜，想要预知前程。反正，我不。当然，不是说一定不要筹划，一定不做攻略。或许，有些人的成功就表现在逐步实现一个又一个小目标和大目标。然而，即使是老天特别眷顾的人，一路上总归也会有很多不确定性。风风雨雨，起起伏伏，不亦乐乎。毕竟，人生的意义并不仅仅在于最后的结果。况且，在现实中，谁会始终都有十足的把握，可以预见未来呢？我们经常免不了在信息不全的情况下作出决定，在擦枪走火的情况下匆忙上阵。据说，了不起的大事业，后人所称道的丰功伟绩，大抵是在不太成熟的条件下做成的，这好像是真的。下棋，固然需要计算，更少不了决断。人生，也是如此。有意思的是，看李世石和柯洁的棋，我们能够体会他们在对局中的心理和情绪波动。而看阿尔法狗的棋，顶多可以揣摩它对当下的棋局形势判断，是紧张还是平稳，真的完全感觉不到 " 心情 " 这回事——抑或是我们主动关闭了这种感受？好像还真不是。我们作为旁观者也能清清楚楚感觉得到，它的每一手棋都是冷冰冰的。▲ 2017AlphagoVs 柯洁大赛（乌镇）第二局：柯洁中局认输（图：视觉中国）李世石说：" 人会有心理上的摇摆，即使知道准确的答案，在下子那一刻还是有可能会选择另一条路，考虑其他的选择。但阿尔法狗不会有任何的动摇，这就是我所面对的最大困难。"" 面对毫无感情的对手是非常难受的事情，这让我有种再也不想跟它比赛的感觉。" 李世石无奈地承认，如果再有机会跟阿尔法狗对弈，情况一定也会非常艰难。▲韩国首尔，2016 围棋人机大战赛场外，李世石与妻女在一起（图：视觉中国）这让我们想起当年的李昌镐，外号石佛，就是在棋盘前永远面无表情，这让他师傅曹薰铉跟他对局也拿他没辙，只好顾自狠命抽烟。如此，好像有点懂得柯洁在第三局认输之后落泪的心情。如果他连输三局给另外一个棋手——这一天终将会到来——多半不会当场落泪。他一定也会在对局中感受到不在现场的那个真正的对手的那种冰冷。输给这么一个冰冷的对手（虽然有个黄博士坐在他对面摆棋，还真不如做一个机器人来摆呢），会有一种异样的委屈吧？大概类似于被欺负了还不知道被谁欺负了，或者被一种知道它存在却又无从捉摸的力量困住了手脚、阻挡住了去路。所以，还是人对人、面对面的对弈，才能称为 " 手谈 "，才更有意思。毕竟，人所下的每一手棋，都带着人的体温。对弈者能够读到对手的各种肢体语言，乃至感受对手呼吸和心跳。人会犯错——计算错误或判断、策略错误，或者，由于人性的弱点，由于轻敌，由于胜券在握而保守，由于恐惧或贪婪，如此等等，各种各样的错误，甚而至于转胜为败——所以，人才可爱。这可并不是因为对方的犯错会给自己获胜的机会，而是看到对方也跟自己一样，值得惺惺相惜。棋逢对手，实乃人生幸事。而棋盘上的胜负，可能无碍于两个对手在棋盘之外成为生死莫逆之交——跟阿尔法狗？那就算了吧。可以相信，我们的老祖宗在发明围棋的时候，肯定没想到这玩意儿竟然会有如此丰富的变化。柯洁感慨，人类对围棋的了解，才刚刚起步。这一个起步，就走了两千多年。取消座子，不过一百多年。吴清源提出新布局，不到一百年。阿尔法狗横空出世，带来一个真正的变革。它结束了一个时代，开启了一个时代。确实，未来已经到来。过去，我们习惯于立足传统，思考未来。这依然有效。但是，现在必须加上另一个维度，我们必须学习如何站在未来，思考现在。虽然没有必要过于夸大，但是，阿尔法狗这个强大的学习者，确实足以成为人类的一个好老师，让我们学到很多，还不仅仅在于下棋而已。* 文汇独家稿件，转载请注明出处。
相关标签：
原网页已经由 ZAKER 转码排版
头条新闻9小时前
头条新闻昨天
头条新闻2小时前
头条新闻3小时前
头条新闻3小时前
头条新闻1小时前
头条新闻昨天
头条新闻8小时前
头条新闻9小时前
头条新闻11小时前
观察者网34分钟前
观察者网1小时前
观察者网2小时前
头条新闻12小时前
观察者网3小时前人工智能“阿尔法狗”横扫围棋高手
央视网消息：过去一周，一个注册名为“大师”的神秘网络棋手一路击败数十位围棋高手，实现了快棋战的60场不败。这个“大师”就是去年“人机大战”当中击败棋手李世石的人工智能程序“阿尔法狗”。
去年12月29号上线后，“大师”在短短一周里连续击败目前世界排名第一的柯洁、韩国目前第一人朴廷桓等多位拥有世界冠军头衔的棋手。“棋圣”聂卫平也输给了“大师”。
4号，“大师”终于透露，自己正是“阿尔法狗”的最新版本，代为落子的则是“阿尔法狗”团队的黄士杰博士。当天与棋手古力的一盘棋是本次网络公测的最后一战。结果古力告负，“大师”实现了60场不败。
“阿尔法狗”是“深度思维”公司开发的一项人工智能程序。“深度思维”公司4号发表声明称，在网络对弈平台进行非正式快棋对局，是为了检测最新版本的阿尔法狗是否如公司预期。
去年3月，“阿尔法狗”以4:1战胜了曾多年占据世界排名第一位的李世石。这场对决让人工智能领域的最新成果获得空前关注。这次新版“阿尔法狗”假装“网络棋手”横扫一众高手的行为，也为接下来的人机对决进行了很好的预热。
有专家认为，快棋形式虽然更利于电脑，但横扫众多围棋高手的战绩很大程度上说明，人工智能程序在节奏更慢的正式对弈中也会有上佳表现。
免责声明：本文仅代表作者个人观点，与环球网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
环球时报系产品
扫描关注环球网官方微信
扫描关注这里是美国微信公众号
扫描关注更多环球微信公众号}

叫阿莫西中心