第十章 预测之耻(第1 / 7页)
由于叙述谬误,我们更容易理解刺猬,他们的观点听起来很不错。名人中有大量刺猬存在,因此名人比其他人的平均预测能力更差。
下面这个例子揭示了一般的思维缺陷。这些“专家”具有偏向性:如果他们对了,他们将其归功于他们的洞察力和专业能力;如果他们错了,他们要么怪具体形势超出常规,要么根本不知道自己错了,并继续编故事。他们很难承认自己的知识有限。但我们的所有行为都有这种特点:我们体内有一种维护自我评价的东西。
我的测试并不正式,它以商业和娱乐为目的,是供我自己消遣而不是为发表而设计的,因此下面我将引用其他研究者更为正式的结果,它们经历了漫长的发表过程。我惊异于人们对这些行业的有用性的反省如此之少。针对三个行业——证券分析、政治学和经济学存在一些正式测试,但不多。在未来几年毫无疑问会有更多测试(也许没有,因为这类论文的作者或许会被他们的同事排挤)。在近100万份政治学、金融学和经济学论文当中,只有极少部分对这些知识在预测方面的作用提出了质疑。
人类在对随机事件的认识上容易犯不对称的错误。我们把成功归因于能力,把失败归因于在我们控制之外的事物,比如随机性。对好结果我们感到有功劳,对坏结果却不感到有责任。这使我们以为我们在谋生的领域比其他人都在行。94%的瑞典人相信他们的驾驶技术在瑞典司机中排在前50%,84%的法国人认为他们的调情技巧在全法国排在前50%。
预测的累积错误在很大程度上来自大的意外事件。不但经济、金融和政治预测无法预测它们,这些预测还羞于提及任何非常规的事,而事实上重大事件几乎总是非常规的。而且,如我们将看到的,经济预测者习惯于互相重复观点,而不是提出接近未来的真相。谁也不愿意突出自己。
这种非对称性的另一个结果是,我们以为自己不同于那些没有这种非对称性思维的人。我已经提过结婚者对未来的不现实预期。想一想有多少家庭对未来进行筛选性假设,他们把自己锁在牢固的房产中,以为会在那里生活一辈子,而不知道人们过稳定生活的记录很糟糕。他们难道没有看见那些衣冠楚楚的房地产经纪人开着漂亮的德国轿车到处转吗?我们是极为漂泊不定的,比我们计划的不稳定得多,而且不得不如此。想一想有多少突然失去工作的人料到了这一点,即使只提前几天,或者想一想有多少瘾君子在一开始是打算长期吸毒的。
泰洛克研究了政治和经济“专家”。他让不同的专业人士判断某个特定的时间范围内(大约5年之后)一些政治、经济和军事事件发生的可能性。他一共获得了大约27000份预测,涉及近300名专业人士,经济学家占样本的近1/4。这项研究表明,专家的错误率比估计的高很多。他的研究揭示了一个专家问题:一个人拥有博士学位和拥有学士学位是没有区别的。发表文章众多的教授相对于记者没有任何优势。泰洛克发现的唯一正常的事实就是名望对预测的消极影响:拥有显赫声望的人比没有声望的人预测得更糟糕。
我“几乎”是对的
但泰洛克并不是只想揭示专家的实际预测能力(尽管该研究在这一点上相当具有说服力),他更希望解释为什么专家们没有意识到他们不太擅长本行,也就是说,他们是如何编造故事的。这种不自知是存在某种逻辑的,主要是信仰维护,或者对自我评价的捍卫。于是他更深入地研究了他的受试者为事件编造事后解释的机制。
鲍查德拿出了一篇令我吃惊的研究论文,这篇论文是一个在他指导下的暑期实习生刚刚写完的,并且即将发表。这篇论文仔细研究了证券分析师的2000项预测。研究结果是这些证券公司的分析师什么也没预测,一个随便把某一期的数字当作对下一期的预测的人也不会比他们做得更糟糕。但分析师们掌握了各家公司的订单、未来合约、计划支出等信息,所有这些信息优势应该能够帮助他们打败某个只看过去数据而没有进一步信息的无知预测者。更糟糕的是,这些预测者的预测错误比单个预测之间的平均差异大,这表明存在结群现象。正常情况下,单个预测之间的平均差异应该与平均预测错误一样大。但为了理解他们如何保住工作,以及为什么他们没有出现严重的崩溃现象(体重减轻、行为怪异或者酗酒),我们必须看一看菲利普·泰洛克的研究。
我不准备谈一个人的自我意识是如何影响他的认知的,我想讨论预测盲点更广泛的方面。
预测的问题更为微妙。它产生的原因主要在于我们生活在极端斯坦,而非平均斯坦。我们的预测者可能更善于预测常规事物,而不是非常规事物,这就是他们预测失败的原因。只要犯一次对长期趋势的预测错误,比如错误地预测利率从6%到1%的长期变化(2000~2001年的实际情况),那么接下来的预测都无法修正你的累积错误。重要的不是你预测正确的频率,而是你的累积错误有多大。
泰洛克的实验还提供了另一个教训。我之前已经提过,他发现许多大学明星或者“顶尖刊物的撰稿人”并不比普通的《纽约时报》读者或记者更善于发现世界的变化。这些过于专业的专家们通常无法通过他们自己领域里的测试。
重大事件出人意料
泰洛克根据评论家以赛亚·伯林(Isaiah Berlin)提出的分类方法,将预测者分为两类:刺猬与狐狸。在伊索寓言中,刺猬只知道一件事情,而狐狸知道许多事情,生活中需要这两类人。许多预测错误来自刺猬,它们在观念上只倾向于一个低概率而影响巨大的事件,从而落入了叙述谬误的陷阱、被一个可能的结果蒙蔽,而无法想象别的结果。
更糟糕的是,许多金融机构每到年底都会发行名为“20××年展望”的书、对来年做出预测。当然,他们不会检查他们之前的预测在事后的准确性。公众不进行下面这个简单的测试就购买这些预测则更为愚蠢——虽然这个测试很简单,但很少有人做过。这个简单的实证检验就是把这些明星经济学家与一个假想的出租车司机(就像第一章中的司机米哈伊尔)做比较:假想一个对比对象,他把最近公布的数字当作对未来的最佳预测,而他本人什么也不知道。接下来你只需要把明星经济学家的错误率与假想的对比对象做比较。问题在于,当你被各种故事弄得晕头转向时,你会忘记做这个测试的必要性。
2006年6月,我去巴黎拜访让·菲利普·鲍查德时,曾向他哀叹这类研究的稀少。他是一个孩子气的人,看上去年纪只有我的一半,实际上却只比我年轻一点。我半开玩笑地将这归因于物理之美。实际上他并不是严格意义上的物理学家,而是一名数理科学家,他运用统计物理学方法研究经济变量(这一领域由贝诺特·曼德尔布罗特在20世纪50年代末开创)。该学科不使用平均斯坦的数学,所以他们似乎对真理感兴趣。他们完全处于主流经济学和商学院金融学之外,他们在物理和数学院系谋得了一席之地,并常常在证券公司谋得一席之地(交易员雇用经济学家主要是为了让他们给不那么精明的客户讲故事,而非为自己服务)。与穿西装、编造理论的经济学家不同,他们使用经验方法来观察数据,并且不使用钟形曲线。
<b>你对自己说你在玩不同的游戏。</b>假设你没能预测到苏联的衰败和突然瓦解(没有哪个社会科学家预测到了这一点),你可以声称你对于苏联的政治体系很在行,但这些极具俄罗斯特点的俄罗斯人善于向你隐藏关键的经济因素。假如你掌握了这些经济情报,你本可以预测苏联政权的终止的。错不在你的能力。假如你曾预测阿尔·戈尔压倒性战胜乔治·W.布什,原理也是一样。你不知道经济陷入了如此可怕的境地;实际上,似乎所有人都没有发现这一事实。嗨,你不是经济学家,而这场游戏实际上是关于经济的。
一些研究者研究了证券分析师的工作状况和态度,结果很令人吃惊,尤其是他们的认知自大。塔德乌什·蒂什卡和皮耶·捷隆卡把他们与天气预测员做了比较,结果是他们的预测能力更差,但他们对自己的技能却更为自信。出于某种原因,在预测失败之后,这些分析师的自我评价并没有降低他们的错误率。
<b>归因于意外。</b>有一些超出系统、超出你的科学范畴的事情发生。鉴于它是不可预测的,你没有什么错。它是一个黑天鹅事件,而你没有责任预测黑天鹅事件。黑天鹅事件本质上是不可预测的。这些事件是“异类”,来自你的科学之外。或者是发生概率非常非常低的事件,如千年一遇的洪水,我们恰好不幸碰上了。但下一次,它不会再发生。这种把眼光局限于狭窄的范围和既定教条的做法,正是数学在社会问题上失败的原因。模型是正确的,但游戏不是人们预期中的那一个。
像牛一样结群