文字稿
【凯】你知道吗,AI现在能做的事情越来越多,但有一个问题一直让我特别好奇——AI到底能不能像人一样进行那种,你懂的,勾心斗角式的策略思考?今天我们就来看一个由Atypica AI完成的特别有意思的研究,他们让10个不同的AI智能体玩了一个叫"11-20金钱请求游戏"的博弈,结果发现了一些让人意想不到的东西。
【艾拉】哦?这个游戏听起来就很有意思。具体是怎么玩的?
【凯】规则其实很简单,但背后的心理博弈却复杂得要命。两个人同时选择11到20之间的一个数字,你选多少就能拿多少钱。但这里有个关键的twist——如果你选的数字恰好比对手少1,你就能额外获得20块钱的奖励。
【艾拉】等等,这就有意思了。所以如果我选17,对手选18,我不仅能拿到17块,还能额外拿20块?
【凯】没错!这就是这个游戏的精髓所在。它不是简单的数学题,而是一个纯粹的心理战。你得猜对手在想什么,对手也在猜你在想什么,然后你还得猜对手在猜你在想什么...
【艾拉】哈哈,这听起来像套娃一样。那人类玩这个游戏的时候表现如何?
【凯】这就是最有趣的地方了。这个游戏最初是两位经济学家在2012年设计的,专门用来研究人类的"层级思考"能力。结果发现,超过50%的人选择了17到20之间的数字,其中32%选17,30%选18。而按照纯理论计算,最优策略应该是选11,但只有4%的人这么做。
【艾拉】为什么理论上应该选11?
【凯】因为如果每个人都是完全理性的,他们会意识到对手也是理性的,然后开始一轮又一轮的推理,最终收敛到最小值11。但现实中,人类的思考深度是有限的,大多数人只会进行2到3轮的迭代思考。
【艾拉】所以Atypica想看看AI能不能模拟出这种人类的"有限理性"?
【凯】正是如此!他们构建了10个不同背景的AI智能体——有博弈论教授、职业电竞选手、退休数学老师、普通上班族,甚至还有德州扑克玩家。然后让这些AI分别玩这个游戏,看看它们的表现如何。
【艾拉】结果怎么样?
【凯】结果让人既惊喜又担忧。惊喜的是,这些AI展现出了惊人的策略思考能力。10个智能体中,9个都选择了17,只有1个选择了18。
【艾拉】等等,这个比例...好像比人类还要集中?
【凯】你抓到重点了!人类的选择分布是17占32%,18占30%,还有其他各种选择。但AI们几乎全部收敛到了17这个"最优解"。这说明什么?它们太理性了,反而失去了人类行为的多样性。
【艾拉】这就像是一群博弈论专家在玩游戏,而不是普通人?
【凯】完全正确!更有趣的是,研究人员还设计了几个进阶测试。比如告诉AI:"你的对手是个随机选择的人,他会在11到20之间随机挑一个数字,你会选什么?"
【艾拉】嗯...如果对手随机选择,我觉得应该选19?因为这样既能保证高收益,又有机会获得额外奖励?
【凯】哈!你已经展现出了Level-1的思考能力。AI们也是这么想的,9个选择了19。但有一个退休数学老师的AI选择了20,理由是"我更喜欢确定性"。
【艾拉】这个AI还挺有个性的。那更复杂的情况呢?
【凯】这就更精彩了。研究人员说:"假设你的对手认为你会随机选择,所以他会选19,你怎么办?"
【艾拉】啊,那我就选18,这样就能获得额外奖励了!
【凯】没错,这是Level-2思考。所有10个AI都选择了18。然后研究人员又问:"如果对手预测你会选18,所以他选17,你怎么办?"
【艾拉】我的天...那我就选16?这已经是在预测对手的预测的预测了。
【凯】正是Level-3思考!令人惊讶的是,所有AI都成功选择了16,并且能清晰地解释这个"套娃"式的逻辑链条。其中那个电竞选手AI说得特别生动:"他以为他算到了我,结果我算到了他算到了我。"
【艾拉】这些AI的解释能力听起来也很强?
【凯】这是整个研究中最让人印象深刻的部分。每个AI不仅知道选什么,还能用符合自己身份的方式解释为什么这么选。比如那个创业者AI把博弈论和商业竞争类比,说"创业就是这样,你得比对手多想一步,甚至多想两步"。德州扑克玩家AI则用"看牌不如看人"来解释自己的策略。
【艾拉】听起来这些AI表现得相当出色。那研究人员发现了什么问题吗?
【凯】问题就在于它们太出色了。这些AI更像是一群训练有素的"理性经济人",而不是真实的人类。在现实世界中,人类会犯错,会有情绪,会有认知偏差。但这些AI几乎没有展现出这些"人性"的一面。
【艾拉】所以如果用这些AI来预测真实世界的行为,可能会得出过于乐观的结论?
【凯】正是这个担忧。研究报告指出了一个重要风险:如果直接用这些高度理性的AI来预测市场行为或社会现象,可能会错过那些由非理性、情绪化决策引发的"黑天鹅"事件。因为真实社会的动态往往由行为的"长尾"而非"峰值"所驱动。
【艾拉】这让我想到,也许我们需要的不是更聪明的AI,而是更"人性化"的AI?
【凯】你说得很对。研究人员建议,未来应该开发不同思考层级的AI智能体,甚至引入一些"认知偏差"模块,让AI能够模拟那些会在Level-1和Level-2之间摇摆的普通人,或者那些会因为损失厌恶而做出非最优选择的人。
【艾拉】这个研究还让我想到另一个问题——如果AI都这么理性,那它们之间的博弈会变成什么样?
【凯】哈,这是个很有趣的延伸思考。想象一下,如果未来的商业竞争是在一群超理性AI之间展开,那可能会出现完全不同的竞争格局。也许我们需要重新思考什么是"竞争优势"——是更深层的理性思考,还是那些看似"非理性"但却出人意料的策略?
【艾拉】这个研究真的很有启发性。它不仅测试了AI的能力,也让我们重新思考了人类决策的价值。
【凯】没错。有时候,我们的"不完美"恰恰是我们的优势。这个研究提醒我们,在追求AI的理性和效率的同时,也要保留那些让我们成为人类的特质——包括我们的直觉、情感,甚至是我们的错误。
【艾拉】感谢大家收听今天的节目。下次当你面临选择的时候,不妨想想:你是在进行Level-1、Level-2,还是Level-3的思考?也许答案会让你对自己的决策过程有全新的认识。
【凯】我们下期再见!