AI骗局:不要怪人工智能有假,只因你不了解其中细节
点击关注,静心科技为您提供不一样的静心视角。
早在2016年的时候,彭博社报道过,初创公司就已经开始营销私人助理机器人——埃米·英格拉姆(Amy Ingram)。公司对外宣称这款机器人是“能够为你安排会议的私人助理”!你只要将电子邮箱发送给埃米,埃米就能以非常甜美的语气开始自己的私人助理工作。
当时人们一度认为,埃米确实比人类更适合这项工作。

但是,经历过一次又一次AI骗局之后,我们才慢慢弄明白,原来AI也是有假。现在我们在看看埃米,如果仔细观察其广告细则,就会发现人类可以随意介入这个“人工智能”系统。营销这个机器人的公司在背后利用全天候工作的人来操控埃米。
当然,还有比这个更早的自动机骗局。
1770年,一个酷似真人的机械装置——“土耳其人”,战胜了绝大多数人类棋手,成为国际象棋高手。公众对于这款机器的痴迷要远远高于之前的沃康松发明长笛演奏者。有人怀疑机器里面是不是有一个小孩,但是每当打开机器内部,就能够发现里面有很多机械齿轮在运作,并没有发现有小孩藏在里面。

“土耳其人”机器人
历任主人对这款国际象棋高手机器的工作原理始终讳莫如深,外界对“土耳其人”历经多年的猜测,却还是无法揭示这款自动机的工作原理。“土耳其人”被创作出的84年后,一场大火烧掉了“土耳其人”。最后一任主人的儿子觉得保守秘密也没有意义,于是公布了“土耳其人”的工作原理。
事实上,“土耳其人”就是一个巨大的木偶人,利用巧妙的机关构成对观众的欺骗。
这些例子表明,我们不应该接受“它采用了深度神经网络”的回答,来掩盖所谓“人工智能”系统的工作原理。因为如果不这样,会让我们陷入到一些毫无根据的人工智能炒作之中。事实上,这种“粗心”的想法让我们轻信了像“土耳其人”这样的骗局。
确保我们不会落入骗局和“甜蜜营销”陷阱的方法之一是仔细研究这些装置背后的细节和工作原理。
深度神经网络如何识别图像中的物体?
在2006年之后的10年时间内,计算机识别图像、语音等的能力已经得到显著地提升。甚至从某种角度上说,计算机已经超过人类在图像识别方面的能力,而这得益于一种叫做“深度神经网络”的技术。不仅仅如此,深度神经网络还能针对一副图片创造出逼真的渲染效果。
深度神经网络本质上就是一种输入和输出之间的映射关系。 一旦网络参数训练完毕,深度神经网络是一个可以预测的,是一个确定性的函数。只要隐藏层足够多,深度神经网络理论上是可以表达任意函数 。而且只要我们仔细研究,就会发现,深度神经网络就是一个分类器 。

但是了解了这些,我们还是无法知道深度神经网络在了解世界的内部表达是什么样,还是不知道深度神经网络在那些时候会表现比较差?要想了解深度神经网络的能力和局限,我们只能去了解深度神经网络背后的细节。
这里以“深度神经网络识别图像中的狗”为例,说明深度神经网络的工作原理。
首先,需要准备让深度神经网络去学习的图片。这些“训练样例”有包含狗的图片,也有不包含狗的图片。而且,为了深度神经网络理解这些图片,需要对样例进行数字编码,这样就能够用数字来表达像素的颜色,从而用数字来描述图片。
因为彩色图片中,每个像素有三种颜色(红、绿、蓝)因此,对于640×480大小的图片,需要921600(640×480×3)个数字来表达。一旦将网络的输入设置为这些数字的时候,就可以开始运行设计好的深度神经网络框架。这些数字会一层层地激活,直到在末端产生一个输出。
可以把神经网络中的神经元想象成一个个打开或关闭的小灯泡。而且,当网络中神经元的激励水平越高,小灯泡的亮度就会越大。一旦网络运行,网络中的一些神经元就会变亮,另一些则会变暗。在深度神经网络识别狗的过程中,我们更关注网络输出的神经元有多亮。

含有两个隐藏层的神经网络
假设我们设计的网络的输出层只有一个神经元,我们称之为“狗神经元”。如果“狗神经元”亮,则说明图片中含有“狗”,反之则不含。如果亮度不暗也不亮,则认为图片中可能有狗,可能没有狗。同样,我们对“训练样例”的标签也做数字编码处理,通过人工标注的方式,有狗则为“1”,无狗则为“0”。
之后,我们就需要将输出的亮度和“训练样例”的标签进行对比,一个输入的末端神经元亮,且该输入的标签为“1”,则认为网络的预测是正确。然后,根据预测结果来评估网络的误差有多大。并将误差反向传递给网络,从而调节每个神经元之间的权重,以便下一次预测误差会变小。直到网络预测完全正确或者绝大部分都正确,则不再调整网络参数。
随着时间的推移,网络会变得越来越准确。原因就在于,我们就是将预测不断逼近我们的训练标签(真值) 。这就是很多标准神经网络的训练方式,尽管很简单,但也直到20世纪七八十年代才被人们真正理,而神经网络此前已经存在了几十年。
如何避免过拟合的问题?
神经网络最大的挑战就是过拟合问题。我们会经常发现,训练好的深度神经网络,能够很好应对与训练样例类似的情况,但是对于训练样例中没有出现的对象,深度神经网络就会表现得比较差。尽管它很好地匹配了训练数据,但它不太可能很好地解释新数据,这就是过拟合的问题 。

过拟合问题说明
一旦神经网络函数无线逼近训练样本,模型的复杂度就会上升,其泛化能力自然变得非常差。
通常,避免过拟合问题,有两种解决办法:一是使用更简单的模型,即使用可调旋钮比较少的模型;二是把更多数据用于复杂模型。目前,研究人员倾向于将这两种办法结合起来,使用尽可能多的数据来训练旋钮较少的网络 。
说起更多数据,不得不提一下,斯坦福大学李飞飞教授的ImageNet数据集。李飞飞之所以出名,一定程度上在于她制作了大量标注良好的图片。当认识到数据对于网络训练会产生巨大作用后,李飞飞和同事开始了一个宏大的项目——ImageNet。到目前,这个ImageNet拥有1400万张高分辨率的图片,标注的类别超过2.2万个。

李飞飞与ImageNet数据集
这个数据集比当时其他数据集要多出一个数量级的标注图片,而且还有很多细粒度标签,比如有达尔马提亚犬、荷兰毛狮犬和迷你雪纳瑞犬。2010年,李飞飞组织了一场名为“ImageNet大规模视觉识别挑战赛”的比赛,数据集采用1000个类别的140万张图片。比赛的前两年,识别错误率从2010年的28%下降到2011年的26%。
但是在2010年的时候,一个不被看好的成功——深度神经网络,成为挑战赛不可争议的赢家,错误率达到16%,远低于之前的26%。这个转变思维模式的深度神经网络被称为AlexNet,这个模型之所以表现出色,在于用大量的数据来训练不太多需要调整权重的网络 。
AlexNet是一个卷积神经网络,通过一系列卷积层(5层),然后一系列全连接层(3层)。那么,这种网络架构设计到底有什么奇特之处呢?
简单来说,卷积层就是通过查找图片中的物体来转化图片。每个卷积层都有一组过滤器,用于查找图片中的不同对象,比如猫、狗等。如果猫过滤器映射出的图片都是暗的,则表示没有找到猫。但对于第一个卷积层的过滤器来说,一般都不会识别出很复杂的物体,部分原因在于第一层的过滤器通常比较小。

AlexNet神经网络架构
AlexNet的第一层的过滤器在11×11的像素块中查找对象,而且采用大约100个过滤器,意味着拥有100个神奇的物体探测器。这些过滤器被称为“边缘探测器”,因为它们匹配输出的是图片的边缘或者其他简单模型。AlexNet另外4个卷积层中每层都有几百个过滤器。每一个连续的卷积层都使用前一层的过滤器作为基本构件,将其组合成更加复杂的模式。
随着网络的不断深入,过滤器捕捉到的成分越来越复杂。慢慢地,你可以开始分辨出物体的连贯部分,有些像毛发,有些甚至像人脸。一旦穿过第5个卷积层,就开始3个全连接层。网络的输出有 1000个不同的神经元,分别对应ImageNet挑战中的每一个类别。

激活网络输出层神经元的图像块,左为大白鲨,右为沙漏
最后,不出所料,点亮大白鲨神经元的图像块似乎有大白鲨,点亮沙漏神经元的图像块似乎有沙漏。但是这些图片中物体并非来自任何一张图片,而是网络自己生成,以精确反映每个神经元找到的内容。
尽管目前,AlexNet并不是最精确和高效的,但是其应对过拟合的思维却影响着后续神经网络的设计。
为什么深度神经网络会如此有效?
是什么让深度神经网络,尤其是AlexNet,在ImageNet比赛中表现得如此出色?AlexNet的网络架构真的非常完美吗?事实上,从理论上说,一个隐藏层就能够表达任意复杂函数,那么,网络真的需要这样深吗?
如果只有一个隐藏层,那么对于复杂问题,我们网络的隐藏层将会变得非常庞大、非常宽。这就需要更多的数据来调整更多的网络神经元权重,否则就会出现过拟合的情况。根据《On the Number of Linear Regions of Deep Neural Networks》这篇文章的理论表明,通过让隐藏层更深而不是更宽,能够更加有效地表达复杂的函数。
换句话说,神经元越少,需要学习的权重就越少!
卷积层之所以强大,在于其使用分布式表达来处理图像。

卷积神经网络
那么,为什么深度比宽度有效?这个其实很好理解。通过一些基本的、少量的共享特征,比如眼睛、耳朵、眉毛、嘴巴、肤色等,可以构建出不同的人种。这样,前几层就可以专注于寻找基本组件,后几层则专注于如何组合这些基本组件。这种做法自然比一次识别出不同形象(更宽的隐藏层)要来得高效。
2012之后,很多ImageNet比赛都开始采用深度神经网络的设计思路。目前,ImageNet挑战赛中的最佳错误率已经达到2.3%,与AlexNet的16%更是精进许多,已经超过了人类的图像识别能力。但是,我们也能发现,目前很多深度神经网络的深度已经变得越来越深,甚至达到看似荒谬的程度。

Inception v2:用两个 3×3卷积替代 5×5
但是,谷歌曾推出22层的Inception Network,为什么没有因为深度而陷入过拟合?原因在于谷歌研发人员发现,卷积层的神经元过于简单,因此采用更多复杂的微型网络取而代之。更重要的是,让每一层使用更少的参数。(例如,两个3×3过滤器和一个1×1过滤器,以及将它们组合起来的3个权重,总共需要22个参数,而一个5×5过滤器则有25个参数)
之后,还有更多改善网络的办法,比如在不相邻的卷积层之间增加连接,能够提高网络性能。比如让神经元在网络一层内相互加强,比如找到了狗耳朵,就会让其他部分更加注重寻找狗尾巴和狗腿。
总而言之,随着科技技术的不断发展,深度神经网络也会变得越来越有效。
结论
目前,市面上有很多宣称是基于深度神经网络的人工智能项目,但真假也的确难辨。要想分清真假人工智能系统,需要更多关注项目背后的细节。
本文从深度神经网络如何识别图像的过程入手,介绍了一个标准的深度神经网络的工作原理。之后针对深度神经网络极易出现的过拟合问题,说明解决过拟合问题可以用“大量的数据来训练不太多需要调整权重的网络” 的思路。
最后,本文分析了为什么深度神经网络会变得如此有效,原因在于网络的深度比宽度更有效。但是,即使网络再深,也需要尽可能减少网络需要调整的参数,从而避免过拟合问题。
未来,深度神经网络必将出现更多更有效的网络模型,要想分辨真假,只能从细节入手!你们怎么看待人工智能有假的问题,欢迎在下方留言评论。
对很多人而言,真相是一种偏好,而不是必需
【编者按】
在日常生活中,我们需要大量信息,但我们经常意识不到大多数信息都是别人告诉我们的。传言、书籍、目击者证词、专家意见乃至商品标签等,这些信息是正确的吗?美国弗吉尼亚大学杰出法学教授弗雷德里克·肖尔(Frederick Schauer)深入探讨了如何评估他人陈述的可信性、辨别专家意见中的偏见。但最重要的是,我们要时刻警惕自己的偏见,因为我们在参考证据之前,往往已经有意无意地扭曲或选择性忽视了我们不喜欢的那部分。本文摘自《实锤:证据在司法、政治及日常生活中的使用与误用》)高虹远译,云南人民出版社·理想国2025年1月版),澎湃新闻经理想国授权刊发。

各种公职人员……发表的“毫无证据”的言论和采取的“毫无证据”的行动越来越多地出现在媒体上,这是本书最初的灵感来源。
这种现象在2020年总统大选后愈发凸显,在2020年11月5日的电视讲话中,特朗普声称自己赢得了大选。他坚称,只是因为普遍存在舞弊现象才让相反的结果成为可能。此后不久,宾夕法尼亚州共和党参议员帕特·图米(Pat Toomey)指出,“没有人向我出示过任何表明腐败或舞弊普遍存在的证据”,因此总统“在没有任何证据支持的情况下提出了非常、非常严重的指控”。伊利诺伊州共和党众议员亚当·金青格(Adam Kinzinger)也呼应了这一观点,他坚称,“[如果]对舞弊有合理的担忧,那就拿出证据来并诉诸法庭”。特朗普的长期盟友、新泽西州前共和党州长克里斯·克里斯蒂(Chris Christie)则直截了当地抱怨说:“拿出证据来。”到2021年2月第二次弹劾审判前夕,参议院是否会听取现场证据的问题被着重讨论和辩论,尽管得出的结论在意料之中,但也许还是令人沮丧:参议院将在完全不听取任何此类证据的情况下作出决定。
尽管一些政治家和新闻媒体注意到了证据的重要性,这一点值得称赞,但公众和政治界对证据的讨论往往停留在证据是什么、证据从何而来和如何评估证据这样松散而肤浅的层面。例如,关于各种问题的评论者经常将缺乏证据与虚假混为一谈,认为缺乏证据就等同于陈述虚假的证明。这样的混淆有待明辨。同样,在公共讨论中,“证据”这一概念常常与众多限定性的、令人讨厌又费解的形容词联系在一起。诸如“确凿证据”“直接证据”“具体证据”“决定性证据”以及许多其他形容词都误导性暗示,缺乏能够排除合理怀疑的压倒性证据就足以否定某个结论,即使实际上至少有一些证据支持这个结论。这种普遍现象也需要更严格的审视,专家的角色——不仅是专家如何使用证据,也包括专家如何得出结论——也需要更严格的审视,因为这些结论之后都会成为那些缺乏必要的专业知识的人做决策的证据。在应对当前事件时,我们经常看到公职人员和其他人对真正的专家在证据基础上得出的结论表现出无知无畏的不尊重,但这些事件有时也会赋予专业人士、专家和专业机构一种远远超出其专业范围的权威。
对真相的需求
证据是判断真假的前提。但是,正如我们会在第十三章里看到的那样,心理学家所谓的“动机性推理”(motivated reasoning)在证据领域司空见惯。遗憾的是,人们如何看待这个世界上的事实,通常深受他们希望这世界怎样运转的规范性偏好的影响。
……
然而,更加根本的是,只有在乎真相的人才在乎证据。我们并不清楚在同样的情境下,真相是否对所有人都有同等程度的重要性。如果我们将真相看作人们可以偏好(或者不偏好)的东西之一,我们就可以理解,人们对真相的偏好与对幸福、爱情、友谊、野心、财富、健康和轻松,以及无数其他感情和条件的偏好相竞争。这些感情和条件有时会与真相冲突,对有些人来说,它们比真相更重要。
尽管当亨利·克莱(Henry Clay)在1839年说他为做正确的事而宁愿放弃做总统时,他更多的是在谈论做人的原则而非谈论事实,但他的名言流传至今,正是因为我们目睹了很多(或者说大多数?)政治家会为做总统而放弃做正确的事。做正确的事是对真相的偏好,但不是所有人都有这个偏好,不是所有人对真相偏好的程度都同样多,也不是所有人都一直偏好真相。
如果真相是一种偏好,那么我们就该想到,可能存在一种关于真相的市场。真相的供应商,也就是证据的供应商,会明白并不是所有人都想要证据,或者想要的程度一样。
尽管这个结论看似让人不舒服,但超市小报的出版商可没有不舒服。很多人热衷于阅读富商名流的落魄经历,这种热衷创造出了对名人落魄细节的不厌其详的需求。而这些信息的提供者,其中以超市小报为主力军,想方设法满足读者的这种需求,无论那些落魄经历是否真实。显然,那些富商名流时运不济、马失前蹄的故事与现实(即证据)越来越脱节,直到人们降低对这些故事的需求。同样明显的是,当对名人落魄经历的描写真实到变得无趣时,对此的需求也会降低。靠博人眼球而成功的超市小报出版商属于那些能最准确地评估人们对耸人听闻的故事的需求和对真相的需求之间关系的人。那些盈利颇丰的小报出版商已经找到了最佳平衡点——在这个最佳平衡点之上增加更多真相(更多证据)或减少耸人听闻的内容都会降低人们对信息的需求。小报生意的成功取决于发现耸人听闻的内容和真相之间的平衡点,使得阅读量最大化(从而使销量和广告收入最大化)。
……并没有很多人认识到,在任何问题上、在任何时候,更多真相(或者更多知识)对任何人(或机构)都同样重要。同样没有被认识到的是,证据作为知识和我们判断真假的基础,在任何问题上、在任何时候,对任何人都同样重要。本书的主题是证据。它建立在证据往往很重要,因为真相往往很重要的前提上。但如果我们想理解证据在这个世界上、在公共政策和个人决策中的位置,我们就需要理解证据和真相并不是唯一的价值所在。
关于专家和专业知识
2020年10月14日,时任法官、现任大法官埃米·科尼·巴雷特在她的确认听证会上被时任参议员、现任副总统卡马拉·哈里斯(Kamala Harris)问及是否相信气候变化正在发生。秉承过去至少30年来最高法院大法官提名人的光荣传统,巴雷特大法官支支吾吾,三缄其口,回应说她不会对气候变化这样一个“具有政治争议性”的问题发表看法。尽管巴雷特将气候变化问题定性为“政治上有争议”是完全正确的,但她因暗示气候变化问题在科学上也有争议而受到广泛批评,尽管她实际上并不是这么说的。
在那些因为他们认为巴雷特说了什么,或者他们认为她暗示了什么,或者因为巴雷特没有说他们希望她说的话而批评她的人中,有些人确实懂很多关于气候变化的科学,但大多数人并不懂。而大部分相信气候变化真实存在,而且有潜在的灾难性后果的人也不懂,尽管这个信念是正确的。于是,我们相信科学家的话。不只是个别科学家,而是研究此类问题的科学家的共识。他们是专家,对我们大多数人来说,气候变化的证据既不是来自我们自己的感知,也不是来自我们自己的研究,而是来自我们相信科学家已经研究过并得出这样的结论。科学家,即专家,告诉我们的话就是我们相信的事物的证据。科学家依靠证据,而我们的证据则是科学家所说的话。
……
巴雷特大法官被问及气候变化问题绝非偶然。这个问题不仅在政治上充满争议,而且是个说明我们必须要依靠专家意见的典型例子。诚然,在汽车维修、家具制造和体育健身等方面都有专家,但在这些领域中,许多人都有一些外行知识,因此,他们常常(有时是错误地)相信自己的外行知识已经足够,并由此(同样,有时甚至常常是错误地)相信他们有足够的知识区分真专家与假专家。
而气候变化问题则不同……然而,我们必须搞清楚谁是专家,就是在这一点上,我们犯了难。作为外行人,我们如何在一个一无所知的领域里确定谁是专家?难道非要自己先成为专家,才能知道谁是专家,才能知道他们说的话是否值得信赖吗?
在非专家用专家结论作为证据前,似乎有必要对专业知识进行评估,以下是针对非专家是否有能力评估专业知识的疑虑提出的几点反驳。首先,非专家往往有能力识别和评估专家结论的合理性,即使他们并不理解其背后的方法和结论。当所谓的专家提出的结论及其理由存在内在矛盾或依赖不合理的初始前提时,即使评估者本身并不了解所谓的专家方法,他们的评估也能否定专家结论。你不需要是天文学家就能知道月球不是由绿色奶酪做的,如果有些自称是天文学家的人说月球是由绿色奶酪做的,那么非天文学家就有充分的理由拒绝接受这个被标榜为专家结论的东西。回到现实中,当一位实验心理学专家声称自己已经证明了预知未来的超自然力的存在时,那些拥有普通(非专家)知识的人即使自己不是专家,也有理由怀疑专家结论的可靠性。至少有些情况下,我们不需要成为专家,也能知道专家靠不靠谱。
对于非专家无法评估他们自己不具备的专业知识的担忧,更重要的一个反驳理由是,即使非专家无法识别和评估专业知识本身,他们仍然可以识别和依赖专业知识的外在特征。这些外在特征可以是诺贝尔奖、加州理工学院和麻省理工学院的终身教席、美国国家科学基金会(National Science Foundation)的研究经费,以及美国科学促进会(American Association for the Advancement of Science)、美国国家科学院(National Academy of Sciences)和英国皇家学会(Royal Society)等被广泛认可的荣誉专业协会的会员资格。当我们依赖专家的资历来确认他们的专业知识时,我们实际上依赖的是我们作为非专家对各种机构认证制度的了解。当然,外行人对这些资历和认证制度的了解可能本身就不如内行人。尽管如此,鉴于资历是专家实际做了什么的证据,对外部观察者来说,了解认证制度可能要比了解专家实际做了什么来得容易。
然而,使用这种可从外部观察到的专业知识的标志并非完美的方法。让我们看一看颅相学。这种所谓的颅相学或多或少是由奥地利医生弗朗兹·约瑟夫·加尔(Franz Joseph Gall)在18世纪末发明的,盛行于19世纪早期和中期,直到20世纪初才逐渐消亡。
……
颅相学和占星术的例子告诫我们,不要过于依赖,或者至少不要仅仅依赖内部标准来评估专家意见的可靠性。所谓内部标准,指专家团体成员自我验证其所在团体的专业知识。
……
这又带我们回到了气候变化和全球变暖的问题上……在这里发挥作用的证据有两种。一种是科学家在得出气候变化是存在的、是由人类引起的,并且人类行动可能减轻其后果的结论时所考虑的证据;另一种是政治家、非科学专业的决策者和公民在断定全球变暖存在时所使用的证据。尽管前者远超本书的范围,但后者却至关重要。如果政治家、决策者和公民持有的关于全球变暖存在的证据主要由科学家的证词(包括结论)组成,那么那些由非科学家组成的团体,即政治家、决策者和公民,应该如何评估和权衡这些证词呢?
联邦最高法院对这个问题给出的答案是,专家证词必须符合外部的可靠性标准。但是,联邦最高法院在关于法律系统使用专家证据的说法中所包含的启示并不局限于法庭上的专家证据。在法庭之外,在一般的调查中,也存在一些超越特定领域的可靠性标准。联邦最高法院在谈论“可靠性”时似乎考虑的就是这一点。在任何领域,无论是核物理学还是颅相学,只要提出因果性或预测性主张,我们就可以通过外部可获得的手段来检验这些主张。这些外部手段既包括证据和调查的基本原则,也包括统计推断的基本原则。或许还有其他类似的理性探究的总体原则存在,但基本思想始终是,我们拥有一些使我们能评估一个领域可靠性的方法和标准,这些方法和标准并非特定领域或学科独有,从而使我们不至于陷入依赖内部自我验证的颅相学困境。或许忠实的怀疑论者会纠结于调查的基本原则、证据推理、统计和数学的可靠性,而其他愿意把这些烦恼留给哲学家的人就大可放心,我们有办法评估整个领域的可靠性,进而评估领域中专家的可靠性,这些办法不需要我们完全依赖专家,因为专家的可靠性恰恰是问题的核心所在。
因此,虽然我们依靠气候学家告诉我们气候变化和全球变暖的原因和潜在后果,但我们并不只是依靠气候学家告诉我们气候科学是可靠的。就像我们并不只是依靠沙特人或得克萨斯人来使我们确信化石燃料的重要性一样。但是,气候科学本身建立在向其他领域学习的基础上,而这些领域的价值已经经历了科学研究和科学有效性的基本原则的检验。鉴于气候科学建立在物理学、地质学和化学这些一般科学的基本原则之上,只要我们有足够多的证据证明这些领域的可靠性,我们就会对这些领域的衍生领域,例如气候科学,也至少有一些信心。
此外,如果有人为了获得某些利益而攻击一个领域的方法和结论,而这个领域在被攻击的情况下生存了下来,那么我们往往可以对该领域抱有信心,即便这不是绝对的。颅相学最终被揭穿为毫无价值的原因之一就是医生们对它提出了质疑,而颅相学并没有经受住这些质疑。我们对气候科学的怀疑也是如此。多年来,石油公司、航空公司和汽车制造商一直对证伪全球变暖预测有着浓厚的兴趣。尽管一直有人在努力证伪这个预测,但这个预测至今却尚未被证伪,这本身就使我们有充分的理由将科学家(即专家)所说的话作为他们结论的有力证据。
重申一遍,我们在这里讨论的问题并不是为什么科学家得出的结论是气候变化是真实的、人为的,并且它的变化速度,尤其是变暖速度,可以通过某些方式减缓。该问题已经成为大量科学文献的主题,而这些文献的数量还在不断增长。即便是那些与共识或主流观点的某些方面意见相左的文献,也承认其核心观点,只在边缘问题上争论不休。因此,对我们来说,问题不在于是什么产生了这些核心观点,而在于作为非科学家的我们为什么应该将这些核心观点视为气候变化的性质和原因的证据。本节得出的启示是:答案在于“因为科学家已经这么说了”,而这个启示及其复杂性贯穿了将专业知识作为证据的整个主题。
动机的机制
理解动机性推理是我们理解在这个世界上,证据何时重要、何时不重要,如何重要、如何不重要的关键。动机性推理的“动机”部分尽管令人失望,但简单明了,而“推理”部分却混合着四种不同的现象,有必要将它们区分开。这四种现象都与证据世界相关,我们可以将它们分别称作动机性制造(motivated production)、动机性传播(motivated transmission)、动机性检索(motivated retrieval)和动机性处理(motivated processing)。
动机性制造是指证据最初产生的方式,即证据的制造。尽管有神探夏洛克·福尔摩斯手持放大镜的形象,但我们使用的大部分证据并不是坐等着被我们发现。恰恰相反,证据往往是有动机的当事人制造或创造的,他们对看似基于证据的结果抱着特定的偏好。这在法庭审判中最为明显,所有证据不是由控方就是由辩方提供的。但这种现象在法庭之外也一样存在。
……
因此,在各种问题中,有动机的各方——尤其是既有财力、社会声望和政治权力,又有动机的各方——可以通过(最广泛意义上的)赞助那些支持他们想要结果的证据创造活动,来填充现有的证据领域。这些做法使有动机的各方当事人参与了动机性制造的过程,这一过程会影响所有寻找某些问题之证据的人所能获得的证据范围的构成。
人们不仅创造证据,还必须把证据传播或传递给那些可能使用它们的人。而传播——传播什么、不传播什么以及如何传播——也会被持特定价值观和目标的人所影响。我们可以将此称为动机性传播。这里,有动机的当事人不仅有常见的嫌疑人,比如有广告代理的烟草公司、有公关公司的炼油厂、有网络大V宣传的生活方式倡导者、有自己的出版物和新闻稿的宣传组织,而且还有看似客观公正的媒体本身。
……
有动机的传播者常常怀有相反方向的动机,这些相反动机相互碰撞的效果可能是有益的。转基因产品的危害可能会吸引些主流媒体和各种宣传团体,但转基因产品的生产商并不缺乏属于自己的资源和权力。受害者、其律师和激进分子会传递有关警察滥用暴力的证据,但警察也拥有自己的信息传播资源。至少对某些话题和争议,各种观点的碰撞或许有助于证据的接收者了解和评估证据实际的证明力。但情况并非总是如此。
关于证据,有一个无可争议的事实:证据的数量庞大。随着互联网和社交媒体的兴起,证据的数量会更大。这个观察似乎正确到无聊,但它揭示了动机性推理的一种重要表现形式。当我们面对铺天盖地的证据时一一套用一个常见的比喻,就好像从消防水龙头里喝水一样——即使是相关的证据,我们也只能选择其中的一部分。时间、精力和心智空间的限制迫使我们必须有所选择,而动机性推理通过证据充分的研究提供给我们的明确启示是,我们不仅在感知方面常有偏差,在理解方面也同样常有偏差。我们常常选择那些强化我们现有信念和偏好的证据,而忽略或者至少看轻与我们的信念相悖的证据。在上面提到的分类中,我们可以称其为动机性检索。
……
政治和意识形态极化研究是动机性检索的一个有力例证。例如,卡斯·桑斯坦(Cass Sunstein)记录并分析了向两极化的政党提供信息是如何加剧了两极分化。在分化的两极中,人们会挑选那些支持他们所在那一极的证据,因此提供额外的证据往往只会加剧而不是缓解两极分化,因为人们只会挑出支持他们已有信念的证据,而忽略其余的证据。关于试图用支持正确信念的证据抵制错误信念的研究给了这个现象另一个更令人沮丧的版本。这种抵制如果有效当然是好事,而且也完全有可能有效,但也有研究表明,那些反驳现有信念的证据反而凸显了与它们对立的证据,事实上常常产生与预期完全相反的效果。
最后一个现象是动机性处理,它与传统意义上的动机性推理最为接近。即使面对所有相关证据,人们通常看待这些证据的方式也只会强化自己原本已有的信念。有时,他们会直接拒绝任何挑战已有信念的东西,有时,他们会曲解数据,好让他们无须否定已有信念或接受与他们偏好的结果不一致的结论,无论在一个不带偏见的旁观者看来,这些数据是多么不可能被曲解。
从动机性制造证据开始,到通过动机性传播对证据进行过滤,再根据检索者的动机和偏好有选择性地检索证据,最后根据这些偏好评估证据,这幅画面令人惊心 。但是,我们不应该因噎废食。如果我们相信证据的重要性和力量,那我们就可以把这种信念作为潜在的矫正器,矫正导致我们用含动机的因而也失之偏颇的眼光看待证据的动机。但也有证据表明,动机性推理是普遍存在的现象。因此,如果我们相信证据的重要性和力量,我们就应该去识别动机性推理的证据。并且,当我们审视证据在实际决策中是如何被现实中的人们使用时,我们也不应该忘记我们对证据的重要性和力量的信念。
尾声
2021年2月6日,在对当时的前总统唐纳德·特朗普的第二次弹劾审判前,夏威夷民主党参议员布赖恩·沙茨(Brian Schatz)说:“我不清楚是否有任何证据能改变任何人的想法。”弹劾审判从来都不重视证据,尤其是这次,作为决策者的参议员在2021年1月6日美国国会大厦遭受冲击时正在现场,亲身经历使他们更加轻视证据。在这样的背景下,参议员沙茨的评论似乎令人沮丧地不言自明。弹劾审判,至少在总统级别的弹劾审判,从来都不是出示证据并仔细考量证据的场合,这次也不例外。
然而,更为令人不安的是,沙茨的评论针对的可能不仅仅是弹劾,也不仅仅是美国参议院的活动。令人遗憾的是,沙茨所说的可能是人类行为和决策过程的典型特征,在这些过程中,我们往往在参考证据之前或者故意绕开对证据的参考而作决定,或者扭曲选择和评估证据的过程。有迹象表明,那些在政治上更老练的人更有可能在政治问题上做动机性推理和证据选择,而不是相反。这也许是因为他们更善于在与他们意见相左的论点或立场中寻找缺陷,却不太愿意在他们自己的立场、论点和证据中寻找及承认缺陷。
从某种重要的方面来说,关于动机性推理的最后一章本可以成为本书任何一章的任何一个部分,作为阅读本书任何一章前的限制条件。本书每一章的前提都是:对某些人来说,在某些时候,在某些问题上,证据很重要。本书是为那些证据对他们来说很重要的人写的,也是为当证据对他们来说变得重要时写的。对于那些认为证据不重要的人来说,再多的证据,再多的证据分析,也无济于事。
来源:[美]弗雷德里克·肖尔
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
相关问答
她拍摄了47部影片,3次获得奥斯卡奖,1次获得埃米奖...
[最佳回答]答案:解析:1.(4分)内容上,从不同侧面凸显了英格丽·褒曼的影响力、知名度和观众对她的狂热崇拜;结构上,以此为导语,可以激发读者的阅读兴趣。(每...