《德州扑克下注思维》:如何在信息不足时如何做出高明决策

本站认证平台《部落先锋》德州扑克比赛平台

今天要推荐的这本德州扑克书是去年2月出版的书,安妮·杜克(Annie Duke)的《Thinking in Bets: Making Smarter Decisions When You Don’t Have All the Facts》(德州扑克下注思维:如何在信息不全的状态中做更明智的决定)。

本书作者安妮·杜克之前一直是一名德州扑克的职业选手,也曾获得过2004年德州扑克WSOP的冠军。在这本书里,杜克将会从一名德州扑克职业选手的视角,告诉你真实世界的决策方式。

这篇文章一共分为三个部分:第一部分讲真实世界的决策特点,以及为什么真实世界更像德州扑克而不是国际象棋。第二部分我们会讲如何寻找事情的真正原因。第三部分则是如何在真实世界中作出理性决策。

在德州扑克职业圈子里面,有一个词叫「结果论」(resulting)。所谓结果论,就是说你以事情的结果,来评判你最开始做的那个决策。

在《下注思维》的作者杜克最开始打德州扑克职业比赛的时候,周围的很多前辈都告诉她,在任何时候都不能以结果论来评估自己的决策,这种思维方式对于职业选手来说非常危险。

那为什么好的决策可能会产生坏的结果?作者杜克告诉我们,真正拥有德州扑克下注思维的人明白,我们做出决策产生的任何结果,其实都是由两种因素决定的:决策的质量,还有运气。

没错,运气在当中扮演着重要的角色。

心理学和脑神经科学告诉我们,我们的大脑天生就喜欢那些确定的东西。我们在人际交往中希望听到对方确切的回答,我们在感情中也希望得到对方给予的确定感。

尽管我们能够认识到生活中的确存在一些运气因素,但我们有时候很难接受这些运气因素起到的作用。特别是当我们自己倾尽了全力,结果仍然以失败告终时,我们是很难接受自己仅仅是因为「运气不好」的。

而在德州扑克的牌桌上,你是没有办法追求什么确定性的。很多时候你计算出了各种决策的概率,明白自己的最佳策略是什么,但是就是因为运气不好,最终输掉了比赛。

这种特性与棋类游戏有着显著的区别。比如在象棋中,你走的每一步棋,你的对手走的每一步棋,都是能够看得明明白白的。这当中牵涉到的运气因素很少——不会从哪儿地上突然冒出一个「车」,然后突然吃掉你的「炮」的。

那么真实的世界更像是扑克,还是更像棋呢?冯诺伊曼给出了答案。

冯诺伊曼是现代电子计算机与博弈论的重要创始人,有人曾经问过冯诺伊曼,说您提出的博弈论,是不是跟玩国际象棋一个道理呢?

冯诺伊曼回答说:「不对,国际象棋并不属于我提出的博弈论。国际象棋是一种能够明确所有条件的,可计算的一种形式。虽然你可能计算不出你下一步走哪里是最佳决策,但这个最佳决策一定是存在的。

但是真实世界的博弈论并不是这样的。真实世界的博弈,有虚张声势,有狡诈的欺瞒,有相互的勾心斗角。这些才属于我所说的博弈论。

也就是说,国际象棋不包含任何未知信息,所有的棋子都明明白白地摆在棋盘上面。因此双方更多的是实力的较量,这其中包含的运气成分非常少。

对于现实生活中的我们来说, 国际象棋并不是一个好的比喻。我们的真实生活中,隐藏了太多隐含的未知条件,这就让我们面临一个重大的挑战:去辨别什么是真正好的决定,什么是干扰其中的运气。

我们的真实生活更像是扑克。在扑克的世界里,我们研究的是在不确定的条件下,如何做出最好的决策。

如果这个世界像国际象棋一样的话,那么所有的结果都只受到决定好坏的影响。商学院的教授们或许会联合数学系的教授,一起计算出成就一个伟大公司的最佳模型,然后指引人们照着这个模型去开创自己的公司。

但遗憾的是,这是一个扑克世界。你可能做出了当下最聪明,最谨慎的决定,但你最终仍然可能输得一败涂地。你可能每天都在闯红灯,但仍然活得好好的;你也可能一直遵守交通规则,却有一天被突如其来的车祸落下了残疾。这些情况在一个国际象棋式的世界里,是永远不可能发生的。

3.寻找原因的难点

德州扑克的规则用最简单的话来说,就是大家手里两张牌,配上牌桌上公有的5张牌一起比大小。一场德州扑克比赛一般会持续几个小时,平均每个小时会进行30把对局。

因此每一场比赛中,选手可能都需要作出上百个决定,而作出这些决定的时间,换算下来也只有几十秒而已。

而你要知道,德州扑克一场比赛的输赢,可能关乎上百万美金。而你作出这个价值上百万美金的决定的时间,用作者的话说,还没有你点菜的时间长。

德州扑克比赛的时候,很多时候大家互相之间并不需要揭露自己的底牌,对方就直接选择放弃跟注,而将筹码拱手让人。这就让你很难从结果中评估你自己的决策,很有可能对手比你的牌更好,如果他继续跟注的话,最后的赢家其实会是他。

这就像很多创业公司,可能这些创业公司最后成功了,但他们并不知道自己成功的原因到底是什么。所以在这种情况下,他们会更倾向于将成功的原因归纳在主观的因素之上,例如创始人的人格魅力,某个时刻团队做出的决策等等。

这些因素不能说不重要,但是很可能决定成败的因素反而是哪些难以被人注意到的,或者我们不愿意承认的点上。例如直接竞争对手因为融资晚了一周而资金链断裂,让你的公司最终在市场中胜出;或者政策制定者之间经过反复的博弈,通过了有利于你的法案,才让你得以继续生存下去。

任何一个变量的改变,对你来说可能都是致命的,更关键的是,你可能压根没有把这些变量放在眼里。

4.AI怎样寻找原因

在当下,我们每个人都能感受到人工智能的强大。尤其是近年来愈加热门的深度学习,更是让我们领略到这个领域的无穷潜力。

有了前面内容的铺垫之后,我们在这里就可以从另一个角度去解析深度学习为什么如此强大:它懂得寻找影响决策结果的真正原因。

我们举个例子,假如我们要训练一个深度学习模型,让它来识别猫和狗。我们的做法是先将一张猫或者狗的图片,转换成数字的形式,让每一个数字代表的就是一个像素点的信息。

如果这张图片的尺寸是100像素乘以100像素,也就是1万像素的图片,那么我们就会用1万个数字(假设是黑白图片)来表示这张图。

用数字来表示图片像素

紧接着,我们会用一个扫描器,去扫描这一万个数字。具体来说,就是给每个数字设置一个权重,这个权重的值的范围在0到1之间,某个像素的权重是1代表着这个像素点对最后的结果有重大影响,0则代表没有什么影响。

最后,我们通过一定的数学运算,用这些扫描器扫描出来的结果,生成一个最终的结果。

这里我们假设我们输入的图片是一只狗,但深度学习模型在第一次训练的时候把它识别成了一只猫。

因为这个模型给了我们一个错误的结果,我们就需要对它进行惩罚。而深度学习模型的强大之处在于,它能够真正地做到赏罚分明——凡是那些说这个图是猫的权重,都给我使劲打;凡是那些说这个图是狗的权重,都重重有赏。

由于每个权重都收到了奖励或者是惩罚,因此这些权重在下一轮训练的时候,就会根据上一轮的结果调整自己对每个像素点的评估。就这样一轮一轮训练下去,每个权重都逐渐找到了自己的评判标准,整个深度学习的模型预测准确率也就随之提高了。

简单来说人工智能的学习方式:精确地总结结果产生的原因,并根据原因随时自我调整。

而在我们生活中,我们总结问题原因的方式大多都是用一种笼统的话语来表述的。例如什么「我没升职是因为领导故意针对我。」

这件事情的原因如果用AI来表述的话,它会说:「你没有升职有18%的原因是有个同事在背后说了你坏话,有27%的原因是因为领导没有注意到你上个月完成了一项出色的工作,有13%的原因是因为你年纪和资历还不够,还有42%的原因是因为你的能力还不算足够出色。」

正确地给每个结果总结原因,我们才能够快速地学习提高,并在下次做出更好的决策。

5.我们要怎么寻找原因

对于普通人而言,想要做到AI那种精确的量化判断,实在是不太现实。那有没有什么办法,能够让我们人脑也能够学会正确总结原因呢?

作者杜克给了我们几条建议。

第一点,是学会从他人身上总结经验。相信你一定有这样的经验,当你的朋友遇到感情或者事业上的问题,向你咨询一些建议的时候,你往往能够一针见血地指出问题的关键所在,并能够为对方分析各种利弊得失。

而一到你自己遇到类似的问题时,你却反而钻进了牛角尖里,找不到问题真正的问题所在。

这个现象其实就给我们提供了一种思路:想要更加客观地总结问题的原因,你可以多从他人的身上发掘经验教训。由于你是以旁观者的角度去看待他人,因此你的内心就不会过多抗拒,你也不会因为自尊心的缘故而不敢将责任摊在自己身上——问题发生在别人身上,你却可以从一旁将原因看得明明白白。

你见到的他人的事例越多,你自然会发现各种事例之间的矛盾之处。在这个时候,你就需要找到这些看似矛盾的事物之间内在的联系,明白不同的决策在不同的环境之下的适用条件。这也正如菲茨·杰拉德所说:

「检验一流智力的标准,就是看你能不能在头脑中同时存在两个相反的想法,还能维持正常的行事能力。」

第二点,是建立一个相互监督的团体。你可以找几个和你志同道合的人一起,大家组成一个追求真理小组。在这个小组里面,任何人都要客观地评估其他人的决策,并且不依据个人好恶作评判。

这点其实和第一点的核心思想类似,就是利用旁观者的心态,理性地对问题进行分析。因为即便你从旁人身上总结出了很多问题的原因,但真正当你遇到问题的时候,你仍然需要一些旁人的指点。

当我们自己遇到什么问题的时候,我们往往会产生一种自利性偏差(Self-serving bias),简单来说,就是把自己获得的成功归因于自身的特点(聪明,勤奋,理性等等),而把自己的失败归因于种种外在因素(难度太大,时机不佳,环境太差)等等。

恋爱挫折,事业不顺,家庭不和,可能对于你来说都有种种的特殊原因,但在这个追求真理小组里面,其他成员能够更清楚地看到这些原因背后的一般性原因。而这些原因可能正是你没办法,或者说是不愿意承认的。

6.决策的障碍

在总结了原因之后,我们就需要进行决策。不要以为找到了原因之后,做出决策就是一件顺理成章的事情。很多时候你就是「懂得了很多道理,但仍然过不好这一生」。因为人类毕竟不是计算机,我们的喜怒哀乐时时刻刻都在影响着我们的决策过程,

德州扑克里面,有一个词叫做「Tilt」,这个词翻译过来应该叫「上头」。所谓tilt,就是你因为心情极度沮丧而采取一系列的冲动行为。

当你处于tilt状态的时候,你已经没有办法进行任何理智思考与决策了,你会不计手牌地跟注,在不该all-in的时候all-in。如果你不能意识到自己处于这种状态,还在继续下注,那么你很可能在最后遭受巨大的不必要损失。因此对于每个德州扑克职业选手来说,认识tilt的状态,并学会调整自己,已经是一堂必修课了。

德州扑克的比赛中,选手需要在短时间内作出至关重要的决策,能留给他们的思考和调整的时间非常少。但在我们的真实生活中,我们其实是有很多时间来思考自己的决策的。但即便是这样,也依然有很多人在作决策的时候只凭自己的直觉,作出冲动性的决策。

这种直觉性的决策在大多数时候的确是有用而且高效的。由于我们在作决策的时候需要调用自身很高的认知资源,因此我们日常生活中的大部分决定都是靠直觉来处理的,这样可以最大限度地节省认知资源,减少大脑负担。

但也正因为直觉思维用起来很轻松,不需要思考太多东西,我们平时对于这种思维方式就产生了很强的依赖。等到真的需要用理性进行思考时,我们就很难想起来调用自己的理性思维了。

7.开启你的理性模式

那么我们应该如何调用自己的理性思维呢?作者杜克同样给了两条建议。

第一条,叫「我们为什么下注?」

很多时候我们之所以不调用自己的理性思考,就是因为我们潜意识里面没有把自己遇到的事情当回事儿。而想要让自己的潜意识对当前的事情产生重视,我们需要做的事情也很简单:给这件事情加点筹码。一旦你需要付出什么代价了,那么你就得好好考虑一番了。

我们在决定的时候付出的代价越大,我们就更可能认真对待自己的决定。当然这不是说你凡事儿都要拿钱出来赌才能认真思考,很多时候你可以学会去想象,想象这件事情成功或者失败的后果。一旦你对这件事情的结果有了一个大致的了解,你就能根据实际情况合理地调用自己的认知资源了。

第二条,叫「10-10-10」法则。

这个「10-10-10」法则最开始是由是由萨奇·韦尔奇提出来的。这个法则的思路也很简单,就是当你在做重大决定之前,想象10分钟之后自己是什么想法;然后想象10个月之后自己是什么想法;最后想象自己10年之后又会是什么想法。

通过思考在不同的时间跨度上,你对这件事情的不同看法,你就跳出了当前的这个思考框架,开始用理智去对当前的事情作评估。

我们举个例子。假设你今年的高考失败了,你心里一直很纠结,不知道自己该不该去复读,那么这个时候你就可以用这个「10-10-10」法则了。

我们先看10分钟之后你会怎么想。10分钟之后,你可能和现在的想法差不多,你依然沉浸在高考失利的痛苦之中,但同时也很难下定决心去再花一年复读。

10个月之后你会怎么想呢?10个月之后,新一年的高考已经快来了,你回首这过去的十个月,自己每天的学习生活非常充实,时间仿佛弹指一挥间就度过了。你突然发现,日子也没有想象中那么难熬。

10年之后呢?你在复读之后去了一所更好的大学,你接触到了一个更好的平台,找到了一个更好的工作。你发现自己花的那一年的时间给自己带来了异常丰厚的回报,你的人生轨迹发生了质的改变。跟现在的生活相比,那个时候的付出已经算不得什么了。

就这样,通过「10-10-10」法则,你跳出了当前痛苦与纠结的状态,把目光放在了长远的将来,你的理性思维也被调动了起来,明白了什么才是更好的决定。

当然这里只是举的一个例子,可能你复读一年并没有考上一个更好的大学,可能将来的大学生活让你大失所望,等等这些风险是你在真实生活中都需要考虑到的。毕竟生活不是鸡汤,它需要的是你审慎而理智的思考与规划。

不过总而言之,这个法则的核心思想就是,你要学会跳出当前的心理状态,从更长的时间跨度去思考当下,考虑不同的决定对自己将来的影响,从而作出更好的决定。

8.反人性本能的下注

当你找到了自己输或赢的原因,克服了内心的非理性因素之后,现在该怎么办?答案很简单:找到获胜概率最大的决策,并至始至终地贯彻执行这个决策。

找到成功概率最高的决策并不难,真正的难点在于,你需要至始至终地贯彻执行它。这就意味着,你需要忍受当前的诱惑,你需要承受短期的波动带来的损失,很少有人能够屏蔽掉这些影响决策的干扰因素。

我们喜欢唾手可得的财富幻影,我们追求一夜暴富的发财机会,我们为短期的波动感到惴惴不安。这些人性的欲望让我们即使能够知道那条正确的道路在哪儿,也很难坚持埋头前行。

在更多的情况下,那些身上筹码越少的人,越愿意去压上自己的全部身家,结果到头来输掉了自己仅有的筹码,再无翻身之日。

在概率论里面,有一个著名的公式叫做「凯利公式」。具体公式在这里我们不展开说,只说它最重要的两个核心思想:1.只玩期望获益为正的游戏。2.除非获胜几率100%,否则在任何时候都不要压上全部赌注。

9.一场漫长的赌局

我们在开头说过,真实世界的生活更像是一场赌局。但与一场赌局比赛的不同之处在于,生活不只是一场几个小时的比赛,它有着更长的时间跨度,也有更多的决策等着你去选择。

在这场漫长的赌局里面,你可能会在某一个时间段里输得一败涂地。但只要你懂得不要随便压上自己的全部筹码,懂得自己当下最大概率获胜的决策是什么,你仍然有机会获得更好的生活。

祝大家好运!

本站认证平台《部落先锋》德州扑克比赛平台

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。

为您推荐