从阿尔法狗看人工智能能通杀任何棋类吗

阿尔法狗再进化!“通用棋类AI”AlphaZero问世
  【环球智能12月7日报道 记者 心月】就在今年10月份,谷歌旗下的创业公司DeepMind发布了AlphaGo Zero。没错,就是之前接连打败围棋世界冠军,李世石九段和柯洁九段的那个阿尔法狗的终极进化版。阿尔法狗项目首席研究员大卫&席尔瓦曾表示,AlphaGo Zero是目前世界上最强大的围棋程序,超越以往所有阿尔法狗的旧版本。
  然而日前,DeepMind 悄悄放出了一篇新论文,介绍了一个AlphaZero。一开始我们差点以为 DeepMind 也学会炒冷饭了,毕竟AlphaGo Zero&在10 月就发出来了。可仔细一看,这次的 AlphaZero 不是以前那个只会下围棋的人工智能了,它是通用的,国际象棋、日本象棋也会下,所以去掉了名字里表示围棋的&Go&。
  据了解,AlphaZero算法可以在8个小时训练击败李世石版本AlphaGo;再用4小时训练击败世界顶级的国际象棋程序S再用2小时训练击败世界顶级将棋程序Elmo。这是DeepMind团队继AlphaGo Zero的研究问世之后,带给我们的又一全新算法,它是&更通用的版本&。
  我们可以看到AlphaZero与AlphaGo Zero有几点不同,首先AlphaGo Zero是在假设结果为赢/输二元的情况下,对获胜概率进行估计和优化。而AlphaZero会将平局或其他潜在结果纳入考虑,对结果进行估计和优化。其次,AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强,而AlphaZero不会。另外,AlphaZero只维护单一的一个神经网络,这个神经网络不断更新,而不是等待迭代。AlphaZero中,所有对弈都重复使用相同的超参数,因此无需进行针对特定某种游戏的调整。
  AlphaZero 的问世是算法和计算资源的胜利,更是人类的顶尖研究成果。DeepMind 愿景中能解决各种问题的通用 AI,离我们是越来越近了。
责编:梁爽
版权作品,未经环球网书面授权,严禁转载,违者将被追究法律责任。
环球时报系产品
扫描关注环球网官方微信
扫描关注 这里是美国微信公众号
扫描关注更多环球微信公众号赢得过围棋冠军,“阿尔法狗”能打败电竞选手吗?
稿源:刘娈的网站
3 月9日,万众瞩目的人机大战AlphaGo(以下称&阿尔法狗&)与李世石之间的围棋对决正式打响。这次比赛,李世石作为韩国冠军选手,身上可谓是背负天 下厚望。因早前人工智能&阿尔法狗&完胜欧洲围棋冠军樊麾令人类颜面尽失,所以这一次所有人都将希望李世石能够战胜&阿尔法狗&为人类争光。
这 几天,整个社会对这场人机大战尤为关注,不仅有各大媒体不断报导,就连各大电视台也正不断轮播放这场世纪大战。截止至目前,&阿尔法狗&与李世石已经大战 四个回合,前三局李世石被&阿尔法狗&击败,第四局李世石胜出,但这场胜利似乎已经来迟。在前三局中,李世石无论是执黑还是执白,均被&阿尔法狗&打得毫 无还手之力,因此这场大战尚未结束人们心中便已经有了一个明确的答案,在围棋这一高大上、文化历史悠久的项目上,人类正式败给了人工智能。
长 久以来许多人都认为围棋是人类智慧的精华,如今人类在围棋这一项目上输给人工智能,某种意义上而言也就意味人类已经彻底输给机器,但社会中那些电子竞技游 戏玩家却不服了,因此社会中关于&阿尔法狗&能否打败电竞游戏选手的探讨油然而生。那么&阿尔法狗&究竟在电子竞技这一项目上能够打败人类吗?大伙不妨一 起来思考一下。
&阿尔法狗&的工作原理
&阿尔法狗&由位于英国伦敦的谷歌旗下 DeepMind公司开发。据DeepMind的团队介绍,之所以&阿尔法狗&可以玩转围棋,是因为它具有两个大脑,一个叫做&策略网络&,负责选择下一 步走法;另一个&价值网络&,负责预测比赛胜利者,每走一步估算一次获胜方,而不是一直搜索到比赛结束,从而减少了运算量。两个大脑配合工作,于是将围棋 巨大无比的搜索空间压缩到可以控制的范围之内。
正是在拥有这种超强的学习能力的情况下,AlphaGo才能够在战胜职业二段樊麾5个月之后,就可以挑战人类顶尖棋手并&战而胜之&。
可即便是如此,&阿尔法狗&同样也存在自己的缺陷,那便是它只能玩特定的套路。&阿尔法狗&自身建立神经网络的基本流程是,首先搜集大量数据样本,然后选择合适模型,让模型学习样本,从中找出数据的内在规律。当前人工智能的一个技术瓶颈,就是解决问题前 先要获取大量高质量数据样本,而人类在学习新事物时往往只需很少的样本。&这就导致问题稍微变化,机器就不行了。例如换成25路棋盘,李世石仍能战,&阿 尔法围棋&就不行了,需要回去重新收集25路棋盘上的棋谱,重新训练模型,&南京大学计算机科学与技术系周志华说。
人工智能是否能打败电竞选手?
&阿尔法狗&能够打败电竞游戏选手?现阶段而言这个可能新不大,随着科技的发展,以后或许能够实现。因为目前人工智能的思考方式要通过人类授予,而诸如《英雄联盟》、《星际争霸》此类电竞游戏其实玩家自己都没弄懂游戏的套路,所以没法交给人工智能一种理性的获胜方式。
以 《英雄联盟》举例,在面对游戏里的每一种局面,没有人能够准确的判断出局面的最优解。如果能计算出局面最优解,那么人工智能凭借准确无失误的完美操作,肯 定可以胜过人类。然而玩家自己本身对《英雄联盟》里所谓的&战术&都还尚且是一知半解,远没有达到人类对围棋游戏的理解深度。毕竟围棋游戏已经经历了数百 年来的细心钻研,并且经验是不断传承的。而电子游戏时常更新,更新等于改变了规则,而改变规则会给经验传承带来极大困难。
所以要想制造出完胜人类的&阿尔法狗&,我们首先要总结出电竞游戏的理性获胜方式,可这个现阶段而言暂时不在人类的能力范围内。因此至少需要等到人类自己把这个游戏玩的差不多明白套路之后,才有能力创造这样的&阿尔法狗&人工智能机器人。
文章:67篇人气:27958
没有花边,也没有哗众取宠,有的只是我对IT产业的观察和思考。
本网页浏览已超过3分钟,点击关闭或灰色背景,即可回到网页阿尔法狗的自对弈50局棋谱已现,我们该如何学习?
阿尔法狗的自对弈50局棋谱已现,我们该如何学习?
昨晚手机被阿尔法狗的自战棋局刷屏了,大家一看棋谱的内容后,既兴奋,又觉得有点不可思议,世界冠军时越就说:“这是来自未来的棋谱”!阿尔法狗的团队宣布将要公开阿尔法狗自对弈的50盘棋谱,这个消息对我们围棋界来说真是天大的好事!有点像当年王重阳走后留下了一部九阴真经,而且还是网络公开版的。接下来,各路武林豪杰肯定会好好地去研究这本武林秘籍!我看网上有人说:“机器的招法是基于深度计算而得来的,人类去学习,这不是东施效颦吗?”我觉得这个说法说对了一半,的确,有很多招法是机器经过大数据计算而得来的结果,没有像它那样强大的计算能力,我们将无法做到和效仿;但为什么我们要去效仿呢?机器还有很多好的招法在我看来,其实是不需要依赖深度计算的,而是凭感觉就能得来的,只不过我们的感觉被自己过去的经验所禁锢和束缚了。其实这次阿尔法狗已经告诉我们,围棋的开局下哪里都可以,其好坏优劣是相对而不是绝对的,关键是看之后的运用。阿尔法狗已经够强了,但从它在布局上的招法来看,它也在不断创新尝试。就像开局点三三,局部下完后,谁好?阿尔法狗也不知道,但它在点完三三之后对子效利弊的理解和运用上比我们高出一筹,所以它无论是点的一方还是被点的一方,都能赢。开局点三三这个局部一下完,就像一个刚出生的婴儿,他与生俱来的性格是没有绝对好坏的,决定他未来成长的是取决于家长如何去引导他发挥性格中好的一面。从这里就可以看出,围棋是活的。所以我们拿到阿尔法狗50盘对局这本武林秘籍后,可以学习,但不要盲目模仿,一旦盲目模仿,你又会陷入到一个新的思想禁锢之中。就连阿尔法狗都在不断创新尝试,而有着心灵能动性的我们,怎么能思想禁锢不前呢?再强的招法,它只是招式,就像武侠小说中说的一样,最后你是要忘掉招式的。所以我们学习这本武林秘籍,学习什么?我觉得,在认真学习阿尔法狗的招法后,你忘掉的的东西就是你真正学到的东西!我们要学的不是具体的招法,而是招法背后所包含的逻辑和意境。如果一味沉迷于招法本身,那你很可能将被阿尔法狗禁锢了自己的思想。我希望看到的是,一年后,阿尔法狗对局中的招法已经被人类棋手再次创新,而不是模仿。这次人机大战第二局,柯洁已经把阿尔法狗带到了悬崖边,可惜由于自己的失误而错过了考验阿尔法狗的机会。有人说:“从阿尔法狗自对弈的棋谱中看,它全盘作战能力非常强,那看来,柯洁第二盘就算下对了,考验了阿尔法狗,估计也没啥大用了。”我对此到是有我的看法:首先,阿尔法狗的棋谱是它自对弈的棋,是机器与机器下的棋,这与跟人下还是有区别的;其次,对阿尔法狗来说,在死活对杀这种相对简单的事情上,可能它并不是最擅长的,出错的概率就会增加,而且就是因为简单,所以它一旦出错,我们是可以抓住的。而那些对我们来说相对模糊说不清的地方(需要基于全局的大数据计算),它比我们厉害多了!所以这种地方就算它出错了,你也抓不住,甚至都不知道它哪里出错了。如果时光倒流回到第二局中盘128手前的那一刻,我还是很想看到让阿尔法狗考试的场面,也许试了还是不行,但不试,又怎么能知道呢?棋友们,阿尔法狗将要公布50局自对弈棋谱,你们觉得学习这些棋谱有用还是没用?有用的话,应该怎么去学习?欢迎在评论区说一说吧?本文来自微信号:“耀宇围棋”,作者胡耀宇。弈客围棋原创整理更多精彩赛事直播,棋文弈事,尽在弈客围棋,下载弈客APP,和热爱围棋的棋友对弈手谈!
本文仅代表作者观点,不代表百度立场。系作者授权百家号发表,未经许可不得转载。
百家号 最近更新:
简介: 最纯粹的足球,最精彩的比赛
作者最新文章阿尔法狗,它的每一手棋都是冰冷的-ZAKER新闻
看阿尔法狗的棋,顶多可以揣摩它对当下的棋局形势判断,是紧张还是平稳,真的完全感觉不到 " 心情 " 这回事——抑或是我们主动关闭了这种感受?好像还真不是。我们作为旁观者也能清清楚楚感觉得到,它的每一手棋都是冷冰冰的。2016 年 3 月 12 日,阿尔法狗与李世石下到 3:0。全世界的棋手只能接受这个事实:人类已经无法在棋盘上战胜人工智能。2017 年 5 月,柯洁来到乌镇,棋迷的期待再次点燃。至于最后的结果,已经没有人会感到意外。不管怎么说,阿尔法狗让全世界更多的人知道围棋,让棋迷前所未有地领悟围棋的 " 深奥幽玄 ",让棋手加深对围棋的理解,善莫大焉。反正,对于棋手和棋迷来说,震撼和遗憾很快会过去。阿尔法狗的胜绩,改变不了他们对围棋的热爱。第二次人机大战,我们学到一个新名词:剪枝。没错,它本来是个园艺活。拿一把剪刀,剪掉一些枝丫,就像给花木理发,让它长得更好。用它来描述思维方式,大致就是排除一些不必要的搜索和计算,让问题简单化。据说,阿尔法狗之所以会在双方边界已经确定的地方先手补棋,彻底排除出现变化的可能性,就是为了此后再也不必考虑这里的应对,可以减少计算量。而人类棋手用不着这样,因为我们会自动屏蔽掉这里的计算,根本就不予考虑。初看起来,阿尔法狗这种下法有些笨拙。人类棋手会把这些棋留到收官阶段,下完它们,只是为了便于数子——如果最后不是中盘胜负,需要数子的话。再说,这样的下法,相当于先行放弃了一些劫材,用不懂棋的人也能懂的话来说,相当于放弃了一些在必要的时候,可以用来讨价还价的筹码。总而言之,要是学棋的人下出这样的棋,一定会被老师骂的。不要说这些不必要的补棋,就是在正常交锋的场合,阿尔法狗的一些下法,也常常让人类棋手大呼看不懂。说它们莫名其妙,那算是客气的。要是人类下出这样的棋,多半会被说成臭棋、俗手,或者,也不跟你讲什么道理,总之就说这棋下得难看,形状不好,味道怪怪的,诸如此类。所以,但凡正儿八经学过一点棋的人,基本上不会下出这样的棋,因为它们早就已经在从小到大不计其数的练习和实战中屏蔽掉了。然而,问题来了。阿尔法狗的剪枝,它的根据是逐个计算、排除。而屏蔽的根据是经验和规律。这个区别太大了。经过两次人机大战,阿尔法狗给人类的最大教训,也许没有之一,就是原来认为不能下或不必下的棋,也是可以下的,而且有可能直接成为妙手,或者为后面的妙手作准备。人类棋手屏蔽了一些下法,固然大大减少了计算量,但是也不由分说地排除了所有这些可能性。而阿尔法狗恰恰因为它的 " 笨拙 ",也因为从来没有人告诉它,哪些下法是可以考虑,哪些下法是应该不予考虑的,它只能把各个可能落子的点都挨个儿计算过来。这样一来,倒是有可能找出人类从来未曾想到过的妙手。所以,好像也没有必要夸大这些妙手有多么神奇,对于阿尔法狗来说,无非就是遵照最基本的围棋规则和计算方法,经过对比,筛选出了那一手棋。实际上,人类棋手也时不时会下出这样的妙手,好像比较常见的是处于劣势的一方,为了败中求胜,冒险尝试一些不常用的、甚至从来没人下过的下法,结果,石破天惊。如果非要说这些妙手有多么神奇,倒不如说它们显示的是围棋的神秘莫测,奇妙无穷。然而,又来了另一个问题。像阿尔法狗那样,把所有的下法、应对、结果全部算好,再来作出抉择,是不是也有点无趣?甚至,我们不禁要问,那还叫抉择吗?甚而至于,在每一手棋落子之前,已经把全部可能性都计算清楚了,还有必要下棋吗?人生之所以还值得一过,理由之一,正在于时不时的有意外的惊喜或遭遇,或者主动去探究未知领域。山重水复疑无路,柳暗花明又一村。要的就是这种豁然开朗的效果。如果在出门之前就已经预定所有细节,如果所有的体验都跟预期的一样,那还有必要旅行吗?就算知道未来的岁月会越来越好,那又怎么样呢?总会有人想要算命、占卜,想要预知前程。反正,我不。当然,不是说一定不要筹划,一定不做攻略。或许,有些人的成功就表现在逐步实现一个又一个小目标和大目标。然而,即使是老天特别眷顾的人,一路上总归也会有很多不确定性。风风雨雨,起起伏伏,不亦乐乎。毕竟,人生的意义并不仅仅在于最后的结果。况且,在现实中,谁会始终都有十足的把握,可以预见未来呢?我们经常免不了在信息不全的情况下作出决定,在擦枪走火的情况下匆忙上阵。据说,了不起的大事业,后人所称道的丰功伟绩,大抵是在不太成熟的条件下做成的,这好像是真的。下棋,固然需要计算,更少不了决断。人生,也是如此。有意思的是,看李世石和柯洁的棋,我们能够体会他们在对局中的心理和情绪波动。而看阿尔法狗的棋,顶多可以揣摩它对当下的棋局形势判断,是紧张还是平稳,真的完全感觉不到 " 心情 " 这回事——抑或是我们主动关闭了这种感受?好像还真不是。我们作为旁观者也能清清楚楚感觉得到,它的每一手棋都是冷冰冰的。▲ 2017AlphagoVs 柯洁大赛(乌镇)第二局:柯洁中局认输(图:视觉中国)李世石说:" 人会有心理上的摇摆,即使知道准确的答案,在下子那一刻还是有可能会选择另一条路,考虑其他的选择。但阿尔法狗不会有任何的动摇,这就是我所面对的最大困难。"" 面对毫无感情的对手是非常难受的事情,这让我有种再也不想跟它比赛的感觉。" 李世石无奈地承认,如果再有机会跟阿尔法狗对弈,情况一定也会非常艰难。▲韩国首尔,2016 围棋人机大战赛场外,李世石与妻女在一起(图:视觉中国)这让我们想起当年的李昌镐,外号石佛,就是在棋盘前永远面无表情,这让他师傅曹薰铉跟他对局也拿他没辙,只好顾自狠命抽烟。如此,好像有点懂得柯洁在第三局认输之后落泪的心情。如果他连输三局给另外一个棋手——这一天终将会到来——多半不会当场落泪。他一定也会在对局中感受到不在现场的那个真正的对手的那种冰冷。输给这么一个冰冷的对手(虽然有个黄博士坐在他对面摆棋,还真不如做一个机器人来摆呢),会有一种异样的委屈吧?大概类似于被欺负了还不知道被谁欺负了,或者被一种知道它存在却又无从捉摸的力量困住了手脚、阻挡住了去路。所以,还是人对人、面对面的对弈,才能称为 " 手谈 ",才更有意思。毕竟,人所下的每一手棋,都带着人的体温。对弈者能够读到对手的各种肢体语言,乃至感受对手呼吸和心跳。人会犯错——计算错误或判断、策略错误,或者,由于人性的弱点,由于轻敌,由于胜券在握而保守,由于恐惧或贪婪,如此等等,各种各样的错误,甚而至于转胜为败——所以,人才可爱。这可并不是因为对方的犯错会给自己获胜的机会,而是看到对方也跟自己一样,值得惺惺相惜。棋逢对手,实乃人生幸事。而棋盘上的胜负,可能无碍于两个对手在棋盘之外成为生死莫逆之交——跟阿尔法狗?那就算了吧。可以相信,我们的老祖宗在发明围棋的时候,肯定没想到这玩意儿竟然会有如此丰富的变化。柯洁感慨,人类对围棋的了解,才刚刚起步。这一个起步,就走了两千多年。取消座子,不过一百多年。吴清源提出新布局,不到一百年。阿尔法狗横空出世,带来一个真正的变革。它结束了一个时代,开启了一个时代。确实,未来已经到来。过去,我们习惯于立足传统,思考未来。这依然有效。但是,现在必须加上另一个维度,我们必须学习如何站在未来,思考现在。虽然没有必要过于夸大,但是,阿尔法狗这个强大的学习者,确实足以成为人类的一个好老师,让我们学到很多,还不仅仅在于下棋而已。* 文汇独家稿件,转载请注明出处。
相关标签:
原网页已经由 ZAKER 转码排版
头条新闻9小时前
头条新闻昨天
头条新闻2小时前
头条新闻3小时前
头条新闻3小时前
头条新闻1小时前
头条新闻昨天
头条新闻8小时前
头条新闻9小时前
头条新闻11小时前
观察者网34分钟前
观察者网1小时前
观察者网2小时前
头条新闻12小时前
观察者网3小时前人工智能“阿尔法狗”横扫围棋高手
央视网消息 :过去一周,一个注册名为“大师”的神秘网络棋手一路击败数十位围棋高手,实现了快棋战的60场不败。这个“大师”就是去年“人机大战”当中击败棋手李世石的人工智能程序“阿尔法狗”。
去年12月29号上线后,“大师”在短短一周里连续击败目前世界排名第一的柯洁、韩国目前第一人朴廷桓等多位拥有世界冠军头衔的棋手。“棋圣”聂卫平也 输给了“大师”。
4号,“大师”终于透露,自己正是“阿尔法狗”的最新版本,代为落子的则是“阿尔法狗”团队的黄士杰博士。当天与棋手古力的一盘棋是本次网络公测的最后一战。结果古力告负,“大师”实现了60场不败。
“阿尔法狗”是“深度思维”公司开发的一项人工智能程序。“深度思维”公司4号发表声明称,在网络对弈平台进行非正式快棋对局,是为了检测最新版本的阿尔法狗是否如公司预期。
去年3月,“阿尔法狗”以4:1战胜了曾多年占据世界排名第一位的李世石。这场对决让人工智能领域的最新成果获得空前关注。这次新版“阿尔法狗”假装“网络棋手”横扫一众高手的行为,也为接下来的人机对决进行了很好的预热。
有专家认为,快棋形式虽然更利于电脑,但横扫众多围棋高手的战绩很大程度上说明,人工智能程序在节奏更慢的正式对弈中也会有上佳表现。
免责声明:本文仅代表作者个人观点,与环球网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
环球时报系产品
扫描关注环球网官方微信
扫描关注 这里是美国微信公众号
扫描关注更多环球微信公众号}

我要回帖

更多关于 阿尔法狗与人工智能 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信