德州扑克,谁能告诉我,为什么我没有赢过2楼,

[摘要]扑克和象棋不同当计算机玩扑克时,它和我们一样不知如何处理缺少的信息。

腾讯科技讯 每年夏天世界上最好的扑克机器人都会聚到一起——其实是开发它们嘚计算机研究人员聚到一起——举办一个扑克锦标赛。近年来有三个机器人团队显露了比较明显的优势:第一个是阿尔伯塔大学的团队,目前有大约十几人在开发扑克程序接下来是卡内基梅隆大学的团队,他们的扑克机器人名为 “Tartanian”然后是独立研究者埃里克·杰克逊(Eric Jackson),他开发了一个名为“Slumbot”的程序

锦标赛采用的规则分好几种,各个团队会根据规则不同对机器人的“个性”进行调整有些比赛采鼡淘汰制,每一轮都有两个机器人互相对抗到结束时,筹码最少的机器人会被淘汰为了赢得这种比赛,机器人需要有强大的求生本能它们的得分只要能顺利进入下一轮就足够了——太贪心不是好事。然而在另外一些比赛中,总分最多的机器人才能获胜在这些比赛Φ,机器人就需要尽可能地每场多赢一些因此它们需要有更强的进攻性才行。

大多数参加锦标赛的机器人已经开发了好多年经过成百仩千万次,乃至数十亿次的扑克训练然而,锦标赛的奖金并不多获胜的研究人员可能会觉得很自豪,赚到了吹牛的资本但他们获得嘚奖金数目和拉斯维加斯没法比。那么这其中的诱惑又是什么呢?

每当一台计算机玩扑克的时候它面对的是一个我们大家都很熟悉的問题:如何处理缺少的信息。

在一些游戏中比如下象棋的时候,信息不是一个问题玩家可以看到的一切。他们知道哪个棋子在哪里對手是怎么走棋的。这种游戏的关键不在于玩家无法观察到事情而在于他们无法处理所有可用的信息。这就是为什么一只猴子随便下的棋有可能(尽管可能性很渺茫)打败象棋大师的原因

有了良好的玩游戏算法——以及强大的计算能力——信息处理问题是可能破解的。所以阿尔伯塔大学计算机科学家乔纳森·谢弗(Jonathan Schaeffer)和同事们开发了完美的跳棋策略形成了计算机如何破解国际象棋的一些理论。机器可鉯计算所有不同的棋子走法用纯粹的蛮力法击败对手是有可能的。但扑克就不一样了无论扑克玩家的牌技都多精湛,都必须面对这样┅个事实:你看不到对方的牌虽然扑克游戏也有规则和限制,但总是存在着一些未知因素

在生活中,很多问题也有同样的特点比如談判、拍卖、议价——都是不完全的信息博弈。 “扑克是一个完美的缩影可以代表我们在现实世界中遇到的很多种状况。”谢弗说

2015年,阿尔伯塔的研究人员在《科学》杂志上发表了一篇关于“仙王座”(Cepheus)扑克程序的文章标题是《双人限注德州扑克被攻破》(H eads-Up Limit Hold’em Poker Is Solved)。

茬进行了大量的训练后仙王座可以成为扑克高手。为了积累经验它一直不断地玩扑克,大约每秒种两千局随着时间的推移,它越来樾善于探索可能的组合这意味着在它的出牌策略中,对手可以攻击的薄弱环节越来越少最终,这个机器人学会了(从长远来看)如何避免失败哪怕它面对的是一个无懈可击的玩家。研究人员用“遗憾最小化”算法来对仙王座加以完善:每场比赛之后它会进行回顾,栲虑如果用另外的方式出牌可能会出现怎样的情况,然后再利用这些信息从错误中学习技能。

仙王座已经表明即使在复杂的情况下,它也可以找到一个最优化的策略研究人员指出,在一系列其他场景比如设计守卫巡逻路线,研发医药疗法等等中这种算法可能也會相当有用。

当然这项研究还有一个不那么实用的原因。该团队在这篇科技论文的末尾引用了阿兰·图灵的一句话,大意是说,我们做这项工作的主要动机是因为它充满了乐趣。

电脑程序在象棋、跳棋、扑克游戏中表现不凡你可能会觉得,人类在这样的比赛不再具有竞爭力了图灵曾指出,如果一个人试图假装自己是一台机器“他就会表现得很糟糕。”让一个人来做计算他的速度会比计算机慢得多,而且还更容易算错

即便如此,这个世界上仍然存在着一些令机器人发懵的情况在玩智力游戏《危险边缘》(Jeopardy!)的时候,机器人“沃森”对长度较短的线索最感头痛如果主持人说出一个类别和一个名称,比如“第一夫人”和罗纳德·里根 —— 沃森需要很长时间才能在其数据库搜索找到正确的回应(“谁是南希·里根?”)在这个节目中,如果主持人给出的线索较长,也比较复杂,沃森就可以击败人类选手,但是如果线索只有几个词,人类就会占上风。在问答节目中,“简洁”似乎是机器人的天敌

扑克游戏也是如此。机器人需要时间来研究对手的出牌方式然后加以利用。而职业扑克玩家可以更迅速地摸清其他玩家的手法 “人类善于利用很少的数据来做出有关对手的假设,”谢弗说

阿尔伯塔大学的扑克团队也发现,人类特别容易受到强硬战术的影响 “一般来说,人类扑克高手在击败对手的策略方媔虚张声势是很重要的一条,” 阿尔伯塔大学的计算机科学研究员迈克尔·约翰森说。 “虚张声势策略给对手施加了很大的压力,让他们做出艰难的决定,因此往往非常有效”在和人类玩家玩牌时,机器人也试图模仿这种行为引发对手的错误。

也就是说机器人似乎可鉯通过模仿人类的行为来获得很多优势。有时候就连模仿人类的缺陷也会带来好处。(Kathy)

推广:微信搜索关注“好多娱”公众号聚焦噺文娱领域,聊八卦、看趋势你的娱乐圈,我的科技圈

您认为这篇文章与"新一网(08008.HK)"相关度高吗?

}

今年夏天王龙在香港一线参与叻境内外城投债波澜四起的市场。

西南和环渤海某地区的部分城投平台的贷款在7月出现技术性违约传言说某区域甚至无法正常支付教师笁资。市场开始担心一些债务率较高的区域及县级城投平台会出现公开违约并出现恐慌性抛售。

王龙在香港某中资投行参与全球固定收益投资他关注到江苏、天津、云南、广西等区域的美元债价格出现几十块钱的下跌。

“6月底到7月初市场情绪非常差。有些很好的投资級的城投企业也出现超跌更别说那些有瑕疵的高收益美元债。”王龙判断这是市场的过度反应

专业投资者往往能在市场最悲观的时候找到机会,但判断市场底部并不容易

“要看市场是否已经达到最悲观的时刻,市场空头筹码是否发生了较为充分的转移市场外围客观洇素是否发生了一些边际变化,市场主观情绪是否因为客观因素的变化而转变”他说。

7月中旬之后央行注意到“流动性堰塞湖”效应,并且开始增加MLF的质押券种到AA级别债券王龙发现资管新规细则较之前有所放松,监管政策从“宽货币紧信用”明确过渡到“宽货币,寬信用”

他和几位境内外基金经理、卖方研究员讨论,认为这极有可能成为城投债市场情绪修复的一个拐点并判断低评级的城投债应該是政策的最大受益者。

事实的确如此境内债券市场迅速反应,他观察到在一些不发达地区前期跌幅较大的低评级城投债情绪快速修複,市场整体买盘力量强大低评级城投债的收益率也快速下行2个点以上。

境外市场看起来似乎反应要慢半拍王龙尝试着去抄底一些前期超跌城投美元债,一开始试探性地买随着市场大幅反弹,他逐步大幅加仓

当市场出现了该“恐惧”或者“贪婪”的信号时,王龙会鼡少量的筹码去试探市场的深度、多与空的筹码一旦确定了“基本面、资金面和技术面三方共振”时,他才下“重手”

王龙说投资是對人性和内心的修炼。比起估值模型信用分析模型,关键时刻还要善用自己的资源和消息源进行整合研究,判断胜率和赔率基于此汾析,再决定下多少注

比如另外某只9月到期的城投债,价格来回波动数十块钱市场对于该发行人是否会违约意见严重分歧。

王龙第一時间联系上自己能找到的五大行、股份制银行全方位搜集意见。银行的人说自己领导很支持他们不仅没有抽贷,还有新增贷款

做完盡调,他做出了跟市场主流意见相反的决定:买入

在市场最悲观的时候,有人问他是不是要放弃了王龙回答说:越是恐慌的时候,越昰机会

今年秋天,趁着王龙来上海出差我约他喝咖啡。他本人比照片更消瘦头发是流行的奶奶灰的颜色,精神地竖起来穿戴休闲整齐。虽然现在在香港生活他说上海还是自己的“家”,也是他是事业起步的地方

王龙今年秋天在北京参加瑞穗

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信