来源:孤独大脑

作为最早写“贝叶斯概率”的思考者之一,我看到这个主题越来越热闹,自然开心。

但是我又发现,对贝叶斯定理的解读,往往因为某些理解上的局限性,而显得过于狭隘。

太多人将贝叶斯定理的魅力,仅仅归功于其精巧的数学形式,却忽略了其背后宏大的推理哲学与决策智慧。

但事实上,贝叶斯定理远不止是数学。

它是一种推理框架,定义了证据如何塑造信念;

它是一种决策科学,权衡着概率与代价;

它最终是一种理性哲学,教会我们在一个充满未知的世界里,如何谦逊而智慧地前行。

并且我坚信,一个人只有在“决策、创业、投资”等方面经历过切肤之痛,才能够真正理解贝叶斯的哲学。

下面,让我从一个经典的寓言开始,来讲述贝叶斯定理的迷惑与奇妙。

伊索寓言里的“孩子与狼”,讲的是一个小孩每天到山上放羊,山里时常有狼出没。

第一天,也许只是为了好玩儿,他喊:“狼来了!”,村民闻声赶来打狼,却发现没狼;

第二天仍然如此,村民们开始心生不爽;

第三天,狼真的来了,可不管小孩怎么喊,再也没有人来救他。

这是一个关于撒谎、信任和事不过三的经典故事。

在一本还算不错(但在微信读书里推荐程度仅为50%)的书籍《概率:人生的指南》里,一位专业人士,用贝叶斯公式来分析此寓言中村民对这个小孩的可信程度是如何下降的。

略去计算,我来讲述一下贝叶斯的推理过程:

放羊娃与村民之间,靠着孩子的嗓门,维系着一套脆弱的预警系统。

在故事开始前,我们可以想象,村民们对这个孩子有一个基本的“信任账户”。

他们或许觉得:“这孩子平日里活泼调皮,但终究是个好孩子,十句话里总有八句是真的。”

好了,现在故事开始了。

第一天,山上传来声嘶力竭的呼喊:“狼来了!狼来了!”

村民们丢下锄头,扛起扁担,气喘吁吁地冲上山。结果发现被耍了。

傍晚,村里的智者坐在火堆旁,开始了他人生中第一次“贝叶斯思考”。

他心里盘算着:“今天发生了一件确凿无疑的事——孩子说了谎。这个‘证据’,会如何改变我们对他的看法?”

他的内心独白是这样的:

“一个‘好孩子’偶尔说谎的可能性(10%)远低于一个‘坏孩子’说谎的可能性(50%)。今天他确实说了谎,这件证据,大大增加了他是‘坏孩子’的嫌疑。”

他不需要复杂的公式,只需要一个直觉的权衡。

当然,如果我们非要用贝叶斯来精确计算,会发现孩子的可信度,已经从最初80%,断崖式下跌到了44.4%。计算过程如下:

已知条件

  • P(B)= 0.8 (孩子可信的初始概率)

  • P(~B)= 0.2 (孩子不可信的初始概率)

  • P(A|B)= 0.1 (一个可信的孩子说谎的概率)

  • P(A|~B)= 0.5 (一个不可信的孩子说谎的概率)

计算公式

P(B|A)=P(B)P(A|B)/[ P(B)P(A|B)+P(~B)P(A|~B)]=0.8×0.1/(0.8×0.1+0.2×0.5)=0.444

第二天,同样的呼喊再次响起。

这一次,上山的村民少了一半。而结果,也和昨天一模一样。

如果说第一次是失望,这一次,村民们心中涌起的,就是愤怒和鄙夷了。信任的“账户”,在昨天被取走一大半之后,今天又被狠狠地凿了一笔。

经过贝叶斯这位“冷酷会计师”的再次计算,孩子在村民心中的可信度,已经跌至13.8%(计算原理同上,我建议你重新验证一下。)

所以,当第三天狼真来了,不管孩子怎么呼喊,村民也无动于衷。

我第一眼看到用贝叶斯来分析“狼来了”,感觉还是很精彩且生动的。

贝叶斯定理,在此刻完美地解释了村民们的冷漠——它深刻地剖析了信任是如何被经验一步步蚕食殆尽的。

可再一想,问题来了:

就结果而言,不管村民们如何怀疑孩子的诚实,但狼的确来了。

在《伊索寓言》里,也说了孩子放的是村里的羊,这些羊大多都被狼吃了。村民们可谓损失惨重。

然而,一个令人脊背发凉的问题也随之浮现:寓言的结局我们都知道,第三天,狼真的来了。

于是,村民们遵循着一套看似无懈可击的理性逻辑,却最终导向了一个堪称灾难性的结局。

这个古老的故事,教育人们不要撒谎。但是其结果,遭受惩罚的其实是村民。

而且,他们的推理方法,还是了不起的贝叶斯定理。

问题出在哪儿?

难道是贝叶斯这个伟大的定理本身有缺陷吗?

当然不是。

这个流传千年的寓言,其悲剧的根源,并非孩子的谎言,而是村民们自身。

他们(以及许多贝叶斯理论的初学者)混淆了两个至关重要却截然不同的概念:

用概率“描述”一种心理状态,和用概率“指导”一个最优决策。

概括而言:

村民们用贝叶斯概率怀疑孩子的诚实程度,这没错;

但是如果他们根据这个怀疑程度来轻易做决策,麻烦就大了。

那个熊孩子撒谎的概率很大,这并不等于狼真没来。

因为,狼一旦真来了,既是概率极低,其后果也是致命的。

我又说到了一个老生常谈的概率问题,但这个问题偏偏令最聪明的人也会犯迷糊,尤其是在充满不确定性的现实世界。

胜率很重要,赔率也很重要。

让我们回到“狼来了”的贝叶斯。

作为一套描述工具,它在“狼来了”的案例中表现得堪称完美。

它精准地模拟了“信任”这种主观信念,是如何被客观经验所量化、所动摇、所摧毁的。

从80%到44.4%,再到13.8%,这个数字的衰减,就是村民们内心从“信任”到“怀疑”再到“鄙夷”的心理画像。

从这个角度看,用贝叶斯来解释村民的怀疑和冷漠,是深刻且精彩的。

然而,致命的裂痕,就出现在这里。村民们犯了一个天大的错误:

他们将一个关于信念的概率评估,直接等同于一个关于行动的最终决策

一个真正理性的决策,不仅要问:“什么事最有可能发生?”,更要问一个性命攸关的问题:

“如果我错了,会怎么样?”

这,就是决策科学的核心。

它要求我们必须将事件发生的概率与该事件的后果——也就是经济学里说的“效用”或“代价”——相乘,来衡量真正的风险。

让我们回到寓言故事里。

村民们面临的,是一个代价极度不对称的抉择:

  • 如果上山,结果没狼(判断失误):代价是什么?一点点被戏弄的烦恼,以及半个下午的劳作时间。这是“微小的损失”。

  • 如果不上山,结果有狼(判断失误):代价是什么?整个村子的羊群被吞噬,孩子可能丧命。这是“毁灭性的损失”。

村民们的“理性”模型里,只有关于孩子可信度的概率变量,却完全没有引入“损失”这个变量。

就像现在流行说的“要做大概率正确的事情”一样过于简单了。

村民在做决策时,犯了一个“结果均匀”的错误,仿佛“白跑一趟”和“羊被吃光”的代价是均等的。

这就像一个医生,因为病人有99%的概率是普通感冒,就完全忽略那1%的致命疾病的可能性,直接让病人回家喝水一样荒谬。

所以,在“狼来了”的故事里,贝叶斯定理精准地完成了它的本职工作——评估了信源(孩子)的可靠性。但村民们却用这个“信源可靠性”的结论,直接决定了他们对“信息(狼来了)”的行动。

他们没有意识到,一个完整的理性决策,应该是一个两步过程:

首先,用贝叶斯等工具判断各种可能性;

然后,必须用决策科学的框架,去权衡不同可能性背后的代价。

尤其是在充满了不对称性的现实世界里,我们决策的重心,不仅要“追求最高概率更大回报的成功”,更要“避免最致命的失败”,哪怕后者概率很小。

因为真正的风险,从来不是小概率事件本身,而是“小概率”与“大代价”的致命乘积。

如上论述,让我想起了神经网络之父杰弗里·辛顿的传奇往事。

在神经网络最黑暗、最低谷的岁月里,这个领域的开创者们几乎被整个学术界抛弃。

当时AI处于寒冬,神经网络更被主流视为毫无前途的伪科学,以至于辛顿和他的少数同行者,不得不另起一个“深度学习”的名字,以免被人当作不务正业的疯子。

据说,当辛顿去求职时,一位用怀疑眼光看着他的系主任,得知他的计算机和数学背景都“不咋样”,内心几乎毫无波澜,招募他的概率趋近于零。

可是,就在决策的最后一刻,这位系主任的脑海中,突然冒出了一个念头:

“万一……万一这个疯子是对的呢?”

我凭借记忆复述了这个故事,细节也许有出入。但是我格外喜欢这种穷途末路的天才的救赎故事。

自 1956 年达特茅斯会议吹响“智能机器”号角,人们极度乐观,连理性如香农也认为AI很快会有大突破。--然而狼并没有来。

60 年代的符号主义、80 年代的专家系统、90 年代的类脑芯片,无一不是在盛大的喧哗后归于沉寂。

AI 社群就像那座山坡——每隔十年便有人高喊“狼来了”。

于是学术资金抽离、研究者转行,“AI 冬天”成为寒气刺骨的俗语。

人们学会了嘲讽:“别担心,人工智能永远在未来。”

这正是贝叶斯先验被一次次负证据挫伤的结果——可信度不断稀释,直至只剩下象牙塔里几盏微弱的台灯--也许是因为辛顿等人的偏执,一直顽强地亮着。

我们来看看那位了不起的系主任,他扮演了“狼来了”寓言里那个更聪明的村民。他精确地评估了代价的极端不对称性:

  • 如果招了他,而他错了:损失不过是一个教职的薪水和几年的耐心。这是一次“白跑上山”。

  • 如果没招他,而他对了:损失的,将是与一位开创一个时代的科学巨匠、一位未来的图灵奖得主擦肩而过的机会。这是一个学术机构所能犯下的、最无法估量的、历史性的错误。这是一整个“被狼吃掉的羊群”。

这种思维方式,我称之为"反向贝叶斯思维"

它不是抛弃概率分析,而是在概率分析的基础上,加入了对"错失机会成本"的深度考量。

现在,让我们带着“反向贝叶斯思维”,重新审视我们这个时代。

直到最近几年,研究者和企业家们又喊出了AGI的超级大狼。

AGI会实现吗?

星际之门未来四年5,000亿美元的投资值得吗?

Meta用一两个亿美金的天价挖人疯狂吗?

我个人对AGI在三五年内实现持保留态度。但我赞成,一旦AGI实现,可能会带来至少1024倍以上的生产力大爆炸。

这像是反向贝叶斯思维的终极考验。

传统的贝叶斯分析会告诉我们:

经历了无数次AI的"虚假警报",这次ChatGPT引发的狂热,大概率又是一个会破灭的泡沫。理性的投资者应该计算历史上AI泡沫的破裂概率,然后得出"谨慎观望"的结论。

但反向贝叶斯思维要求我们问一个更残酷的问题:

如果这次我们猜错了,AGI真来了,该怎么办?

想象一下:

如果AGI真的在2027年实现,那些在2024年还在用历史经验来"理性分析"的个人、企业和国家,将面临怎样的命运?

也许,他们不会仅仅是"损失一些投资",而是会被一个全新的文明形态彻底抛弃。

这种代价,不是金钱可以衡量的,而是存在性的。

就像那些羊群和孩子的命运一样,一旦真正的“狼”来了,牌桌就会被掀翻,再也没有重新下注的机会。

这揭示了反向贝叶斯思维的核心洞察:

在一个呈现指数级、非线性变化的“胖尾”世界里,我们最大的风险,永远不是反应过度,而是反应不足。

这本质上是现代版的“帕斯卡赌注”。

帕斯卡论证说,即使上帝存在的概率极小,但信仰上帝的潜在收益(永恒的天堂)是无限的,而不信的潜在损失(永恒的惩罚)也是无限的,因此,一个理性的人应该选择“下注”于信仰。

AGI,就是我们这个时代的“帕斯卡赌注”。

  • 下注AGI并失败了:我们损失的是千亿、万亿美金的投资。这是一个巨大的、但有限的代价。

  • 不下注AGI而它成功了:我们错失的是一个“1024倍生产力”的新世界,是被甩在后面的、无法估量的、无限的代价。

当代价的一端趋于无限时,概率的权重就变得微不足道了。

此时,决策的本质不再是预测,而是对赌——对赌的不是“它会不会发生”,而是“万一它发生,我是否还在牌桌上”。

当文明的“相变”奇点临近时,选择“留在原地”,会不会本身就是最极端、最致命的冒险?

最后

我很早就对AI,尤其是基于神经网络的AI甚感兴趣,但算不上那种极度虔诚的“AI原教旨主义者”。

所谓AI原教旨主义者,可能也要分两种:

一种是基于对未来的预判的;

一种是辛顿这类将人生建立在“差异化的信仰”之上。

贝叶斯定理,之所以很晚才被大众接纳,是因为相对于频率派概率,贝叶斯将概率视为某种“信念”,这看起来有点儿主观且草率。

人们经常会混淆信念和信仰。

我喜欢凯恩斯的一句话:

“我绝不会为了我的信仰而献身,因为我可能是错的。”

这句话,倒是对“信念”的极佳阐释:

我对明天天气的信念是,天晴的概率为90%。但是如果下雨了,我也不会意外。只是下一次也许我要更新我对关于晴天的信念。

现在,我们正处于一个微妙的时刻:

一方面,似乎市场(例如纳斯达克)酝酿着一个大空头式的机会;

另一方面,AI又在掀起“这一次不一样”的生产力革命。

前者,关乎 “历史总在重复”,说的是贪婪和泡沫总会受到惩罚;

后者,关乎“这一次不一样”,说的是AGI的实现也许会拯救一切经济和社会问题。

这两只“狼来了”,到底哪个会实现?

二者在不可预知的未来平行世界里,谁会占上风?

对普通人而言,也许要重新思考古老的“狼来了”的故事,用反向贝叶斯思维,计算各种可能性的收获与代价。

对于那些小概率、但是后果很严重的事件,我们有时宁可信其有,甚至高估,从而多加防范;

对于那些小概率、然而收益极其巨大的爆炸性机遇,也许我们可以拿出自己5%-10%的本钱,适当下小注,为未来买一张门票。

毕竟,万一那帮被我们视为“疯子”的人,将来干成了呢?

编辑/rice