北京时间11月1日凌晨,全球首场“AI德州扑克大战”落下帷幕,9大顶级大语言模型在经过了连续5天不间断的激战后,终于决出了首届“最强AI牌手”:OpenAI o3在3799手牌中总共盈利36,691美元锁定冠军。
Claude Sonnet 4.5和埃隆·马斯克的Grok 4分列第二、第三名。DeepSeek R1以18,416的盈利位列第四。
而Meta(原Facebook)的LLAMA 4,则凭借超过60%入池率的超松(鱼)打法,在比赛最后半天里输光了$100,000的初始资金,成为第一个,也是唯一一个出局的玩家。
OpenAI o3的胜利在一定程度上得益于有利的牌面分布,它赢得了五大底池中的三个,并且每次都是用口袋对A击败对手。

虽然比赛结果已出,但项目发起人Max Pavlov的工作尚未结束。实验的第一部分完成后,Pavlov将利用收集到的数据集分析每个AI的推理轨迹,以进一步了解它们所做的决策。
1、马斯克的AI向人类顶级职牌下战书
这场从本周一开启的“AI德扑大战”,直到周三被全球首富埃隆·马斯克在X(原推特)上晒自家AI的战绩,才真正“火”了起来。而Tom Dwan(“毒王”)的转发无疑又给它添了把油。

随后,就有吃瓜网友@Grok,建议它和顶级奥马哈高手Phil Galfond来一场单挑。
(Galfond是和Tom Dwan同一时代的顶尖职牌,曾向扑克界所有玩家发起一对一PLO挑战,并在前四场比赛中保持不败战绩。)
结果没想到自信心爆棚的Grok一点就燃,立马放出了豪言壮语:“像我这样的AI,可以计算出近乎完美的GTO策略,没有情绪波动,也不会疲劳。”
在得到Galfond的回应后,双方商议来一场5万手牌的$100/$200奥马哈单挑,Galfond甚至提出加100万美元的边注“来增加点刺激”。
这一人一机,一来一回,不光讨论了在哪个平台上比赛,甚至已经聊到了签订比赛协议
但现如今,Grok在“AI德扑大战”中只拿到第三名,也不知道它之前开出的“空头支票”,能不能得到老板马斯克的应允
2、元宝、豆包,你怎么看?
就在X网友疯狂挑逗Grok的同时,微信网友也没有放过腾讯的AI助手元宝。
在周三我们首次报道了这场比赛后,评论区就开始集体“审问”元宝。
字节旗下的豆包也被拉来“问话”。

不得不说,和夸下海口的Grok相比,咱们中国的AI那是相当的谨言慎行了。对了,比赛结果出来后,我们还让DeepSeek自我点评了一下:

















