笔趣阁
会员书架
首页 >其他小说 >黑天鹅 > 第十五章 钟形曲线――智力大骗

第十五章 钟形曲线――智力大骗(第1 / 8页)

上一章 章节目录 加入书签 下一页
推荐小说:

“真正的”数学家的“真正的”数学,比如费马(Fermat)、欧拉(Euler)、高斯、阿贝尔(Abel)和黎曼(Riemann)的数学,是完全“无用”的(“应用”数学和“纯”数学都是如此)。

我一生中喝过许多杯咖啡(它是我最上瘾的东西)。我从未遇到杯子从桌上跳起两英尺的情况,咖啡也从来没有自动从杯子里流到这份书稿上。要想发生这类情况,需要的可不仅仅是对咖啡上瘾。它可能需要超过人们想象的时间才会发生,概率太小了,是1后面加上许多零分之一,我用全部的业余时间可能都写不完这个数字。

我之前提到过,钟形曲线是由一个赌徒编造的,他就是亚伯拉罕·棣莫弗(Abraham de Moivre,1667—1754),一个法国加尔文派的避难者,他一生中大部分时间生活在伦敦,说着口音浓重的英语。但凯特勒才是思想史上最具破坏性的人,而不是高斯。

怎样制造灾难

注:在平均斯坦,随着样本规模的增大,被观测到的平均值越来越稳定,在图中可以看到,曲线越来越窄。这就是一切统计理论的工作原理(或者所谓的工作原理)。平均斯坦的不确定性在平均化之下消失了。这就是人们常说的“大数定理”。

如果你使用“统计显著性”这种说法,请小心它所带来的确定性假象。人们有可能把观测误差按照满足高斯分布的条件处理,而这要求它必须来自高斯环境,比如平均斯坦。

图15–2 大数定理的原理

为了看清高斯方法的误用多么普遍以及危害多么大,请看一部由多产作家、大法官理查德·波斯纳(Richard Posner)撰写的(无聊的)书《大灾难》(Catastrophe)。波斯纳哀叹公务员对随机性的误解,建议政府的政策制定者向经济学家学习统计学。法官波斯纳看上去正在努力制造灾难。尽管属于应该多花时间读书而不是写书的人,他还是有可能成为具有洞察力的、深刻的、原创的思想家。和许多人一样,他只是不知道平均斯坦和极端斯坦的区别,他相信统计学是“科学”,而不是骗局。假如你碰到他,请告诉他真相。

高斯变量之外不存在标准差,即使存在,也无关紧要,并且说明不了什么。但事情却变得更糟了。高斯变量家族(有许多朋友和亲戚,比如泊松分布)是唯一能用标准差(以及平均值)描述的分布。你不再需要别的东西了。钟形曲线满足了那些容易上当的人对简化论的需求。

如果你在大学上过(无聊的)统计课,不明白教授为什么兴奋,不知道“标准差”是什么意思,不要担心。标准差的概念在平均斯坦以外毫无意义。假如你上过审美神经生物学或者殖民地时期之后的非洲舞蹈课程,这显然对你更有好处,也更具娱乐性。从经验主义的角度,这一点很容易看出来。

还有一些在高斯世界之外没有意义或没有重大意义的概念:相关性,以及(更糟糕的)回归。它们在我们的方法中根深蒂固,在商业谈话中不听到“相关性”这个词是很难的。

爱上确定性

要想了解相关性在平均斯坦以外多么没有意义,只需要看一看涉及两个极端斯坦变量的历史序列,比如债券和股市,两只股票的价格,或者美国儿童图书销量变化和中国化肥产量,又或者纽约房地产价格和蒙古股市收益率。计算这些成对变量在不同子期间的相关性,比如1994年、1995年、1996年,等等。计算结果很可能表现出严重的不稳定性,它取决于计算的期间。但人们谈论相关性时仿佛它是某种真实确定的东西,人们倾向于把它实际化、具体化,并赋予它物理属性。

<img alt="" src="/book/uploads/2022/04/20220428-09-13.jpg" />

凯特勒的平均怪兽

安全的咖啡杯演示了高斯变量的随机性是可以通过平均来消除的。如果我的咖啡杯是一个大粒子,或者能够表现为一个大粒子,那么它的跳跃就是一个问题。但我的杯子是由数万亿非常小的粒子组成的整体。

这种叫作高斯钟形曲线的怪兽并不是高斯的杰作,虽然他对此做了研究,但他是进行理论研究的数学家,而没有像那些统计科学家一样对现实的构造发表言论。G.H.哈迪(G.H.Hardy)在《数学家的歉意》一文中写道:

但从物理上讲,我的咖啡杯是可能跳跃的,这是非常低的可能性,但仍是可能的。粒子一直在跳跃。但为什么由跳跃的粒子组成的咖啡杯本身不跳呢?原因很简单,要让杯子跳起来,所有粒子必须向同一个方向跳跃,并且连续这样同步跳几次(同时导致桌子向相反方向移动)。我的咖啡杯的数万亿粒子不可能同时向一个方向跳;在宇宙的整个历史中这种情况也不会发生一次。所以我可以安全地把咖啡杯放在写字台的边缘,去操心更严重的不确定性来源。

其结果就是,对高斯变量平均值的偏离,或者说“误差”,不会造成麻烦。它们很小,可以忽略。它们只会在平均值附近引起温和的波动。

同样的具体性假象也会影响所谓的“标准”差。选取任何价格或价值的历史序列,将之分割为子序列,计算“标准”差。奇怪吗?每个子序列会有一个不同的“标准”差。那为什么人们还要谈标准差呢?想想吧。

上面的例子就是平均斯坦最高法则的应用:当你有大量赌徒时,单个赌徒对总体只可能造成微小的影响。

请注意,正如叙述谬误一样,当你拿过去数据计算出单一的相关性或标准差时,你忽略了它们的不稳定性。

赌场经营者非常明白这一点,这就是他们从不亏本的原因(如果经营得当的话)。他们不让赌徒下大注,而喜欢让许多赌徒下很多受限制的小注。赌徒的总赌注可能有2000万美元,但你不需要为赌场担心:每注平均可能只有20美元;赌场对最大赌注设了上限,赌场老板因此晚上可以安心睡觉。所以赌场收入的变化会小到可笑的地步,不管总赌注有多大。你永远不会看到谁带着10亿美元离开赌场,在宇宙的整个历史中都看不到。

点击切换 [繁体版]    [简体版]
上一章 章节目录 加入书签 下一页