为什么一提到专家,脑子里想到的是「砖家」?

到底是谁最先想出“砖家”这种说法,现在也许已经无法考证了;然而这种说法的盛行,无疑折射出一种广泛存在的社会现状:我们不相信专家,或者起码是其中的一部分。特别是当持有对立观点的双方进行辩论时,双方都会选择性地从“专家”意见中选择或者解读出有利于己方的结论,攻击对方的“专家”不可信也不失为一种有效的进攻手段。那么,到底是什么因素导致我们相信一部分“专家”,而不相信另一部分呢?

Cheng & Hsiaw (2016) 提供了一种新的行为经济学视角,作者将其称为“Pre-screening”,其核心的想法是:我们不仅不知道世界的真实状态——因此我们需要从专家那里获取信号来加以“学习”——也不知道我们的信号来源,也即“专家”本身的可信程度。当我们确信专家的可信程度时,我们可以直接根据信号进行贝叶斯更新来(理性地)调整我们对于世界真实状态的信念(我们称这样的人为 Bayesian);然而,当专家的可信程度也未知时,我们需要先根据信号推断专家的可信程度,然后再结合可信程度以及信号调整我们对于世界真实状态的信念(我们称这样的人为 Pre-screener)。注意到,在这一过程中每个信号都被使用了两次(作者称之为“double-counting data”),这样做的结果是过度推断:举例来说,某位老师在批改卷子时,由于对某个学生存在“差生”的印象而将其回答得不明确的答案判为错,然后又因为得分低而认为自己对该学生是“差生”的判断正确——显然,这位老师的做法在一定程度上陷入了循环论证和错误的“自我强化”。(这个例子来自 Rabin & Schrag(1999);本文作者提出,如果将本文中先更新专家可信程度再更新世界真实状态信念的顺序颠倒过来,所得到的结论将会接近于 Rabin & Schrag(1999)所建立的 Confirmation Bias 模型的结论。)

由于 Bayesian 和 Pre-screener 对信号的使用方式不同,即使面对的是相同的信号,双方仍然会产生分歧;甚至不同于对 Bayesian 我们有“信号顺序不影响信念”的结论,对于两个 Pre-screnner,当收到一连串只有次序不同的信号时,也会产生不同的信念进而造成分歧。

先描述一下本文中模型的设定:

世界真实状态有两种可能 A 或 B,个人只知道其先验分布,需要通过专家给出的信号 a 或 b 来做出推断;专家的可信度有两种可能 H 或 L,可信度高(H)的专家以严格大于 1/2 的概率 pH 给出与真实状态对应的信号(A 对应 a,B 对应 b),而可信度低(L)的专家给出对应信号的概率 pL 将更接近 1/2(也就是说,以各 1/2 的概率给出信号的专家最不可信)。

这里有个重要的假设:专家的行动不是策略性的,换言之,我们假定专家不会因为自己的利益而扭曲信号。这一假设并不符合现实,事实上策略性行动也是我们不相信“专家”的重要原因之一,作者对此的回应是:本文做出这样的假设,目的在于区分不同的 channel 的影响,也就是说,如果 A 和 B 两种因素都存在时导致了 C 的结果,我们无从知道这其中 A 和 B 是否都起作用,此时需要控制住其中一种因素而只考虑另一种因素发挥作用;另外,作者也认为,有理由相信即使引入策略性行动的假设,结论在大方向上也不会发生变化。

个人对于世界真实状态和专家可信程度各有一个先验分布的“信念”,下文的小部分结论对这两者的先验分布不加限制,这样的好处是,我们的分析可以从任意时间点“开始”,而不用考虑之前已经接收到的信号和进行的学习;但大部分结论都要求世界真实状态(的先验分布)是等可能的,这样的假定也很自然——在没有任何信息的情况下,也只能猜测概率是一半一半。

作者定义一组信号序列的“信息内容(Information Content)”为其中包含的 a 信号的数量 na 和 b 信号的数量 nb,如上所述,Bayesian 的推断只和“信息内容”有关,而和信号次序无关。由于 A/a 和 B/b 的对称性,除非另加说明,下文的结论都假设已收到的信号中 na 大于 nb。

最后,作者定义,对于信息内容 na 大于 nb 的一组信号,如果 Pre-screener 推断为状态 A 的概率严格大于 Bayesian 的推断,则称为乐观(optimistic),严格小于则称为悲观(pessimistic);如果 Pre-screener 推断专家可信度为 H 的概率严格大于 Bayesian 的推断(注意 Bayesian 虽然也可以根据信号更新对于专家可信程度的信念,但是不会用这一更新的信念而仍是用先验分布推断世界的真实状态),则称为过度相信(overtrust),严格小于则称为信心不足(undertrust)。作者特别强调这些用词本身并不意味着 A 是更好的状态,选择 A 完全只是出于对称性的考虑,并且使用这样的词汇可以方便叙述。

模型的假设和用语基本上都交代清楚了,我们来看看作者给出了哪些结论:

命题 1: 当世界真实状态等可能时,Pre-screener 和 Bayesian 对于世界真实状态的推断在事前的期望是相同的,但是这两者的差的平方在事前的期望严格为正。

换言之,这两种人在事前的预期没有分歧,但是一定存在至少一组信号序列使得两者在事后产生分歧

命题 2: Pre-screener 是乐观的当且仅当他过度相信专家;反之,Pre-screener 是悲观的当且仅当他对专家信心不足

由于我们总是假设信号序列中包含有更多的 a 信号,如果 Pre-screener 更相信专家是可信的,自然也就更相信世界处于状态 A;其它结论亦然。

这一结论可以推广到两个 Pre-screener 之间的比较:

命题 3: 如果两个 Pre-screener,分别称为 J 和 M,收到了“信息内容”相同但顺序不同的两组信号序列,则J 比 M 更乐观当且仅当 J 比 M 更相信专家,反之,J 比 M 更悲观当且仅当 J 比 M 更不相信专家。(此处“乐观”、“悲观”、“更(不)相信”的定义类比上文)

接下来,作者转向另一个问题:随着新的信号出现,信念和分歧会如何演变?

引理 1:当世界真实状态等可能时,如果 Pre-screener 收到一组信息内容为 na 和 nb 的信号序列,则当该序列为先 na 个 a 信号再 nb 个 b 信号时,对专家的信任最高;当该序列为先 nb 次(a, b)交替再 na-nb 个 a 信号时,对专家的信任最低

可以看出,连续的相同信号会给人“高可信度”的第一印象,反之,连续的交替信号则会给人“低可信度”的第一印象;由于 Pre-screener 过分重视已有信息,第一印象的影响将会更加持续。

问题来了,需要多少次反向冲击才能扭转第一印象呢?

命题 4:当世界真实状态等可能时,为了扭转正面的第一印象,假设在 na 个 a 信号之后紧跟着 m 次(a,b)交替:当 na 为 1 或 2 时,只需 m=1 次交替就能使 Pre-screener 转向悲观;当 na 大于等于 3 且 pL 和 pH 满足一定条件时,正面第一印象将持续到至少 m'>3 次反面冲击之后;为了扭转负面的第一印象,假设在 nb 次(a,b)交替后紧跟着 m 个 a 信号,则当 pL 和 pH 满足一定条件时,负面第一印象总能持续到至少 m*>3 次正面冲击之后。

命题 4 给出的是下限,命题 5 则讨论了更加长期的影响(换言之给出了上限):

命题 5:当世界真实状态等可能时,无论 pL 和 pH 如何取值,正面的第一印象总能够被扭转;当 pH 充分高时,负面的第一印象永远不可能被扭转

信号的来源同样影响到信念与分歧的演变,如果信号来自同一个专家,我们有:

命题 6:如果 Pre-screener 先收到 k 个 a 信号,之后又从同一个专家处收到 k 个 b 信号,则此时他与 Bayesian对专家可信程度的推断不同,但对于世界真实状态的后验概率不存在分歧

反之,如果部分信号来自第二个专家,我们有:

命题 7:当世界真实状态等可能时,如果 Pre-screener 先收到 k 个 a 信号,之后又从第二个专家处收到 k 个 b 信号(假设两个专家的先验分布概率相同但独立),那么:
1. Pre-screener 认为状态 A 比状态 B 可能性更高,且第一个专家比第二个专家更有可能是高可信度 H;
2. 当 k 趋于无穷时,对于 Pre-screener 来说,状态 A 的后验概率趋于 1,第一个专家为高可信度 H 且第二个专家为低可信度 L 的后验概率也趋于 1

这一结论的根源是,当第二个专家发出第 1 个至第 k-1 个 b 信号时,由于前 k 个 a 信号的影响,Pre-screener 对于第二个专家可信度低的印象都会加深一点,而到第 k 个 b 信号时,对第二个专家的可信度低的印象恰好达到最大值(只有在此之后接着收到 b 信号才会开始降低)。

命题 8:继续考虑上一命题的场景,不过允许专家一次性传递多个独立信号,则
1. 假如第一个专家获得了独立的 k 个 a 信号,则分成 k 次发出比一次性发出 k 个更能获得 Pre-screener 的信任
2. 第二个专家仍然在第一个专家发送完信号后行动,假如第二个专家获得了独立的 k 个 b 信号,则一次性发出这 k 个信号将比分成 k 次发出更能获得 Pre-screener 的信任,但是并不能达成逆转

由于 Pre-screener 对可信度的印象会累积,第一个专家分成 k 次发出相同的 a 信号将会不断获得累积加成;反之,第二个专家一次性发出 k 个 b 信号,虽然避免了负面印象的累积,但无法抵消第一个专家的上述“加成”,因此 Pre-screener 仍然更相信第一个专家。

最后,作者试图将自己的理论和已有文献的解释,特别是 Confirmation Bias 加以区分:

命题 9:从世界真实状态等可能的先验分布出发,Pre-screener 接收到一组信号序列后,形成了对世界真实状态的后验分布的信念;如果某个 Bayesian 对世界真实状态的先验分布的信念与该后验分布相同,则当 Pre-screener 又接收到一个新信号后:
1.(a) 如果新信号加入后,a 信号的数量仍严格多于 b 信号,且新信号提高了专家的可信度,则Pre-screener 比 Bayesian 更乐观
(b) 如果新信号加入后,a 信号的数量仍严格多于 b 信号,且新信号降低了专家的可信度,则Pre-screener 比 Bayesian 更悲观
(c) 如果新信号加入后,a 信号的数量和 b 信号相等,或新信号不影响专家的可信度,则Pre-screnner 和 Bayesian 不会产生争议
2. 如果此时 Pre-screener 对专家可信程度的后验分布信念和 Bayesian 对专家可信程度的先验分布信念也相同,那么新信号加入后,Pre-screener 对专家可信程度的新信念和 Bayesian 更新后的信念相同。(再次强调,Bayesian 虽然可以进行更新,但是不会用更新后的信念作为下一步的权重)

为什么这与 Confirmation Bias 不同呢?Confirmation Bias 认为,如果我们坚信某一状态是真实状态,我们将采信证实这一信念的证据而忽视否定这一信念的证据,进而加强我们的信念;但在命题 9 中,如果采信证实信念的证据(a 信号)反而降低了专家的可信度(这是有可能的),竟然会削弱我们的信念。作者认为,后一种情况在现实中也是能普遍地被观察到的。

命题 10: 当世界真实状态等可能时:
1. 当na 显著大于 nb,且不同可信度专家之间很难区分(比如高可信度专家的 pH 充分接近 1/2)时,Pre-screener 总是比 Bayesian 乐观,表现出 Confirmation Bias;
2. 当na 多于 nb 但充分接近,且不同可信度专家之间很容易区分(高可信度专家的 pH 充分接近 1)时,Pre-screener 总是比 Bayesian 悲观,与 Confirmation Bias 的预测相反。

作者还讨论了其它一些解释该问题的框架,例如过度自信(Over-confidence)、处理信息的能力有限导致的未注意(Inattention)、媒体的策略性说服(Media and Persuasion)、有限理性(Bounded Rationality)等。作者的一些观点包括:

  1. 部分框架假设了异质的先验信念,而未解释这种异质性的来源;本文建立的模型解释了为何从同质的先验信念出发,获得“相同”的信息也会产生异质的后验信念。
  2. 对于有限能力或有限理性的框架,作者的观点我觉得可以概括为“杀鸡焉用牛刀”:如果在贝叶斯框架下通过一定的 modification 就能进行解释,则无需动用这些大杀器。
  3. 作者对于策略性行动的反驳,在上文中已经提到过了。另外,作者认为本文的结论也给出了一些策略性行动的建议(比如命题 8 中是一次性发出多个信号还是分多次发出信号)。然而,我个人认为这样的反驳是不充分的:在进一步的理论分析完成之前,我们无法打包票说,引入专家的策略性行动一定不会改变结论——特别是当我们知道专家会策略性行动时,我们会以此进一步改变对于信号的理解或使用方式;更何况,这里完全没有涉及到对专家的效用函数和成本函数的讨论,而显然这两者都会对最终结论产生影响。(另一篇工作论文,Deb, Pai & Said(2017)就讨论了这样一种情况:公司希望雇佣高质量专家,但是专家的质量无法直接观测,于是公司要求专家对未来某个公开事件进行预测;专家自己可以获得私有的信息,并有策略地向公司提供信号以提高公司对自己质量的评估)
  4. 最后,作者指出,本文的大部分结论都是可测试的(Testable),因此我们完全可以通过实验的方式将本文的模型与其它框架加以区分。

最后总结一下本文的观点,方便营销号们写爆文(写了 10w+ 以后致谢我一下就好),如果想蹭热点的话,我觉得最近李薛之争是个不错的切入点。

除了专家有策略地行动之外,对专家意见的分歧可能还有一个重要的原因:我们不知道专家的可信程度,需要通过他们给出的信号进行推断,在这一过程中陷入了“pre-screening”重复使用信息导致过度推断的陷阱。

在“pre-screening”的过程中,我们发现:我们对专家的信任程度与对世界真实状态的推断高度相关;专家提供证据的顺序很重要,是多次提供少量新证据还是一次性提供大量新证据也会影响信任程度(很符合心理学家在法庭上的发现);如果我们只有一个信息源,第一印象比较重要,正面的第一印象总会被扭转,负面的第一印象则可能永远持续(就像“狼来了”的故事那样);但如果我们有多个信息源,则第一印象将会异常重要,先来的专家会选择逐步放出证据来提高可信度,后来的专家需要一次性提供远多于前面专家的反方向证据才有可能扭转局势(正所谓“造谣张张嘴,辟谣跑断腿”);但是,我们也并不像 Confirmation Bias 所描述的那么盲目地相信有利于己方的证据,而是会根据证据来源的可信度变化相应调整我们的信念(换言之,辟谣还是能成功的)

Reference:

Cheng, I. H., & Hsiaw, A. (2016). Distrust in Experts and the Origins of Disagreement. SSRN Working Paper.

Deb, R., Pai, M. M., & Said, M. (2017). Evaluating Strategic Forecasters. SSRN Working Paper

Rabin, M., & Schrag, J. L. (1999). First impressions matter: A model of confirmatory bias. The Quarterly Journal of Economics, 114(1), 37-82.

(Photo credit: KarenBaijens via Visualhunt.com / CC BY 2.0)

查看知乎原文
← 返回文章列表