《学会提问》
第1章 学会提出好问题
一种方法是不管读到什么还是听到什么都一股脑儿地接受,久而久之习以为常,你就会把别人的观点当成自己的观点,是他人所是非他人所非。但没人会心甘情愿地沦为他人的思想奴隶。
另一种更为积极进取也更令人钦佩的方法是提一些较有力度的问题,以便对自己所经历的东西到底有多大价值自行做出评判。
海绵式思维和淘金式思维
两种思维方式互补。
海绵式 思维有以下两个显著优
点:
第一,吸收外部世界的信息越多,你就越能体会到这个世界的千头万绪,而你获取的知识将会为以后进一步展开复杂的思考打下坚实的基础。
第二,相对而言,这种思维方式是被动的,它并不需要你绞尽脑汁地去冥思苦想,因此来得轻松而又快捷,尤其当你看到的材料本身已是井井有条又生动有趣时,这种思维方式更显成效。
缺点:对各种纷至沓来的信息和观点如何做出取舍,它提供不了任何方法。
淘金式思维 自己掌握主动权,选择该相信什么忽略什么。而要做出决定和取舍,你就得带着一定的态度去读书,即带着问题去读书。这种思维方式需要你积极主动地参与进来。作者在向你细说原委,而你则随时准备与之辩驳,虽然作者本人根本就不在场。
淘金的过程为积极主动的读者和听众提供了一种可效仿的模式,他们得尽快决定自己的所见所闻到底价值几何。在一场互动的对话中披沙拣金,需要你不断地提问并思考问题的答案。
先问一问“关我什么事”
一寸光阴一寸金,在决定花大把光阴去客观评估一个问题之前,最好先问一下自己:“这个问题关我什么事?”
弱势批判性思维和强势批判性思维
弱势批判性思维是利用批判性思维来捍卫自己现有的立场和看法。强势批判性思维是利用批判性思维来评估所有断言和看法,尤其是自己的看法。
强势批判性思维并不一定就要迫使我们放弃自己的初始看法。它可以为我们进一步坚定自己的看法提供坚实的基础,因为辩证地检查那些看法有时候可以巩固我们当初对它们的支持,从而让我们变得更加笃信不疑。
换句话说,就是思想开放和思想封闭这两种状态。
第2章 论题和结论是什么
我们把没有证据支撑的断言称为纯观点(mere opinion)。
第3章 理由是什么
一个人有没有头脑,主要的标志就要看他能否提供充足的证据来支撑他的看法,尤其当这些看法存在争议没有定论时更是这样。
第4章 哪些词语意思不明确
越抽象的词语,你越要警惕。
小心那些带感情色彩的词语,会让你的思维短路。
第5章 什么是价值观假设和描述性假设
很多争论,归根结底是价值观上的冲突。
人们对特定的价值观往往不会明说。
大多数人拥有某些相同的价值观,大多数人也有其特别的价值观。
价值观和价值倾向有所区别 当你在一场特定的论争中发现了一个人的价值倾向,你不应该期望同一个人在讨论不同的论争时还会持有相同的价值取向。离开了相关的讨论论题,一个人就不再持有同样的价值倾向。
选择价值取向需要一个推理的过程。这种推理和其他推理一样可能有凭有据、考虑周详,并且细心体贴。但是它也有可能是草率马虎、固执己见。因此,价值取向需要有一定的正当理由,这样批判性思考的人才能加以考虑。一个价值取向需要有证实它的理由,正如任何一个结论都需要理由一样。这样我们每个人才能研究其推理过程,然后形成我们的评价。
第6章 推理过程中有没有谬误
- 滑坡谬误 指假设采取提议的行动会引发一系列不可控的不利事件,而 事实上却有现成的程序来防止这类连锁事件发生。
- 追求完美解决方案谬误 指假设因为尝试某种解决方案后还有遗留问题 未解决,那么这种解决方案根本就不应该采用。
例子:
家里添一套安保系统纯粹是浪费钱。如果贼要光顾你家,他们总归想得到办法,无论你装什么系统都不 管用。
还有一些其它谬误:
- 偷换概念谬误 指在论证中关键词语有两种或两种以上的含义,一旦不同含义之间的转换被认出来,这个论证就讲不通了。
- 诉诸公众谬误 指通过引述大部分人都持有这一观点的说法来竭力证明某个论断有道理,错误地假设大部分人喜欢的一切就是有道理的、可以接受的。
- 诉诸可疑权威谬误 指引用某一权威的话来证明结论,但该权威对这一论题并没有特别的专门知识。(如果权威在这一方面专业,那么是OK的。例如,用“大部分医生坚持慢跑”来证明“慢跑有好处”,这是正确的。)
- 诉诸感情谬误 指使用带强烈感情色彩的语言来分散读者或听众的注意力,让他们忽视相关的理由和证据。常被用来加以利用的感情有害怕、希望、爱国主义、怜悯和同情。
- 稻草人谬误 指歪曲对方的观点,使它容易受到攻击,这样我们攻击的观点事实上根本就不存在。
- 虚假的两难选择谬误 指当现实中存在两种以上的选择时却假设只有两种解决方案。
- 乱扣帽子谬误 指错误地假设因为你为特定事件或行为提供了一个名称,你也就合情合理地解释了这一事件.
看个例子:
我反对政府的儿童发展项目。第一,我感兴趣的是保护祖国的儿童。社会规划师和自以为是的鼓吹家常常会扰乱儿童生活的正常发展过程,将他们从母亲和家人身边夺走,使他们变成通用计划的试验品,这些计划设计旨在20年里让这些孩子感到无比的幸福,我们就是要保护儿童不受这些计划的干扰。儿童就应该和母亲一起成长,而不是在一系列的临时看护或护士的帮助下长大。现在争论的问题是父母还该不该继续有权利塑造子女的性格,或者拥有所有权力的国家该不该被赋予各种工具和技术来塑造其年轻人。
第7章 证据的效力如何:直觉、个人经历、典型案例、当事人证词和专家意见
- 直觉有时可信有时不可信。
- 个人经历容易使论证以偏概全
- 典型案例也是。例如,活灵活现地描述某个肝肠寸断的故事,具体生动而又细致感人的例子。这会极大干扰我们的批判性思维。
- 当事人证词通常用处不大。大多数情况下,我们忽略即可。因为当事人证词往往是带人的主观因素的、选择出来的。
- 专家意见更可信。但需要记得:1. 专家也会犯错。2. 专家的意见是否在其专业领域。3. 专家的个人情况会不会导致其意见扭曲(例如,问校长是否削减教育经费)
第8章 证据的效力如何:个人观察、研究报告和类比
- 观察者,不像特定的镜子,并不能给我们提供“纯粹”的观察。我们所“见”所说的都是经过一系列的价值观、偏见、态度和期望值过滤后剩下来的东西。我们见到和听到的东西都是我们愿意听到和见到的东西,我们挑选和记住的那些经历的侧面都是和我们此前的经历和背景最相符最一致的那些侧面。此外,很多情况下都有各种重要的障碍阻止我们看清楚所发生的一切,比如说注意力无法集中,观察事件的快速进行,以及压力重重的环境。例如,你可以假想一下,如果一个人挥舞手枪指着银行出纳,而你站得离他非常近,你的观察有可能出现的偏差。
- 研究报告往往十分权威。但作为论据并不必然是可靠的。
- 研究的质量有高有低
- 研究成果常常会互相矛盾、与金主的立场有关。
- 作者或演说者常常歪曲或者简化研究结论。
- 研究的“事实”会随着时间的流逝而发生改变
抽样调查(其它笔记里面记过了,这里就省略了)
第9章 有没有替代原因
- 过度简化因果关系谬误 在某种意义上,几乎所有的因果解释都会过度简化。但某些简化会影响论证。
- 把相关性当做因果性
- 存在它因、因果倒置、互为因果 冰淇淋销量与犯罪率有相关关系。存在它因:气温。
- 事后归因谬误 把时间顺序当做因果关系。“在这之后”不等于“因为这个”
第10章 数据有没有欺骗性
- 图表刻度 好几本书上写过这个。
- 平均值 这个也早已被广泛熟知了。
- 省略数据 下面给3个例子
(1)大公司正在将市中心地带的小镇气息破坏殆尽。就在去年,城里的大公司的数目增长了75%。
(2)尽管大家都挺害怕,但跳伞运动其实比其他活动比如说驾驶汽车要安全得多。拿某一个月的时间来做比较,这段时间里,洛杉矶有176人死于车祸,而死于跳伞事故的却只有3人。
(3)艾滋病预防项目需要较大的资金投入。2009年,有54000人饱受艾滋病的折磨。
第一个案例隐藏了基数,可以让百分比看起来很大。
后两个案例隐藏了百分比,使得基数看起来很大(或很小)。
第11章 有什么重要信息被省略了
忽略重要信息的原因有很多,可能是想要欺骗你,有可能是为了行文顺畅,可能是作者认为理所当然。
判断有什么重要信息被忽略需要很多专业知识。
第12章 能得出哪些合理的结论
不要有非黑即白的二分式思维。
可以问自己以下问题:
(1)结论在什么时候是精确的?
(2)结论在什么地方是精确的?
(3)结论为什么或为了什么目的才是精确的?
(不过,当你抛弃非黑即白的二分式思维时,你的劝告可能会很无聊)
以解决问题为导向 如果问题是“应当关闭某酒吧,因为已经有很多大学生酒精中毒”,那么答案肯定是Yes。但更加好的问题应当是“如何避免大学生酗酒”,这就有很多答案了。
《批判性思维工具》
虽然教育者总是把“批判性思维”挂在嘴边,但是根据我35年来作为大学教授、作家和社会知识分子的经验来看,没有几个人真的明白如何思考。
思维之所以给我们惹麻烦,因为我们经常:
- 头脑不清醒、混乱或者很困惑
- 过早地下结论
- 没有听懂别人的言外之意
- 没有目标
- 不够现实
- 太重视琐事
- 没有注意到矛盾的存在
- 相信不可靠的信息
- 问的问题模棱两可
- 对问题的回答也模棱两可
- 问的问题太多
- 问的问题彼此之间毫无联系
- 把不同类型的问题混淆在一起
- 勉强回答一些无法回答的问题
- 得出结论所依据的信息不准确或者不相关
- 故意忽略不能支持自己观点的信息
- 仅凭经验就做出推断
- 歪曲事实
- 没有注意到自己推断出了何种结果
- 没有将推理与假设区分开来
- 得出不合理的结论
- 没有注意到自己所做的假设
- 做出毫无根据的假设
- 想法没有重点
- 想法与问题没有关联
- 想法混乱
- 思考问题时利用的是比较肤浅的概念
- 用词不当
- 忽视看待问题的恰当视角
- 只能从自己的角度看问题
- 意识不到自己的偏见
- 思路狭隘
- 思维不严密
- 思维不合逻辑
- 思维片面
- 想法过于简单
- 想法过于肤浅
- 思考时以群体为中心
- 思考时以个体为中心
- 想法不理智
- 应对问题时没有仔细推理
- 决策欠佳
- 与人交流有问题
- 没有洞察到自己的无知。
为什么要培养批判性思维能力
我们面临的问题,每个人都认为思维是我们的本能,但是我们的大部分思维就其本身而言都是带有偏见的、扭曲的、片面的、信息不足的。
大脑有三个基本功能:思维、感受与需求。
思维就是大脑产生意义的部分,它可以为我们生活中的事情赋予意义,也可以创造观点。
感受源于思考。思考通过评价我们生活中发生的事(是积极的还是消极的)来形成相应的感受。感受会不断地告诉我们:“对于生活中发生的事,我就应该有这样的感受。我做得非常好。”或者告诉我们:“我可能遇到麻烦了。”
我们的需求可以为我们的行为提供动力,并与我们认为值得拥有和可能拥有的事物保持一致。它一直在不断地告诉我们:“这是值得拥有的,去争取吧!”或者告诉我们相反的话:“这不值得拥有,别费劲了。”
思维是控制感受与需求的关键。
下面列出的就是一些人类思维当中经常会用到的心理标准。
- “因为我相信这是真的,所以这是真的。”
- “因为我们相信这是真的,所以这是真的。”
- “因为我想要相信这件事是真的,所以这是真的。”
天生的自我满足:我相信一切让我(或我所属的群体)感觉积极的事。我相信“感觉良好”的事,以及无需我大幅度改变思维或必须承认自己不正确的 - “因为我一直相信这件事是真的,所以这是真的。”
- “因为相信这件事是真的对我有利,所以这是真的。”
这种现象是由下列社会中心主义思维引起的:
- 倾向于不加批判地将自己的文化、民族、宗教凌驾于他者之上。
- 倾向于不加批判地、自利地对自己进行正面描述,并对与自己想法不同的人进行负面描述。
- 倾向于不加批判地吸收集体规范和信念,以集体身份示人,按照集体的期待来行事,却毫不认为自己的所作所为应该被质疑。
- 倾向于盲目遵守集体限制(许多集体限制都是专制或强制性的)。
- 思维无法超越文化中的传统偏见。
- 无法学习和吸收其他文化中的见解(若能学习和吸收,则能提高其思维的深度和广度)。
- 无法将普遍的道德规范与相对的文化标准和禁忌区分开来。
- 无法意识到任何文化中的大众媒体都是从各自的文化视角制造新闻的。
- 无法从历史和人类学的角度来思考(因此只能局限于当下的思维方式)。
- 没有将社会中心主义思维当成理性发展中的一种巨大缺陷。
- 社会中心主义思维是非批判性社会的标志。只有用跨文化的、公正的思维(批判性思维)将其取代,才能消除这种思维。
记住,头脑只有在可以自我控制的时候才是自由的。
思维模版
开头:上述材料认为 XXXXXXXX 。这一结论基于以下几方面的引述:XXXXXXXX。不难看出,这一论证并非无懈可击,因为它有以下几个方面的不足。
- 不当假设:上述材料由 XXXXXXXX 推出 XXXXXXXX ,显然是不当地假设 XXXXXXXX 。然而 XXXXXXXX ,因此该论证是欠妥当的。
- 因果无关:论述者通过 XXXXXXXX 这一前提,得出 XXXXXXXX 结论。看似很有道理,其实两者并不想干。因为 XXXXXXXX 。论证者要加强论证,还需提供更为合理的因果关系。
- 存在他因:该论述只指出多个原因中其中一个为事件的主因。 XXXXXXXX 之外,还可能有其它原因,例如 XXXXXXXX ,但他们和 XXXXXXXX 一样,不一定是主因。
- 类比不当:论述者由 XXXXXXXX 不必然推出 XXXXXXXX 状况。因为 XXXXXXXX 都是不同的,上述论证显然存在“不当类比”的嫌疑。
- 混淆概念:上述材料中的 XXXXXXXX 与 XXXXXXXX 是两个不同的概念,前者代表着 XXXXXXXX ,而后者代表着 XXXXXXXX ,在概念界定不清的情况下,论述者的论述显然是不足为信的。
- 条件关系类错误:上述论证显然错误地使用了条件关系,因为 XXXXXXXX 。例如: XXXXXXXX ,因此论述者还应该正确分析相关关系。
- 以偏概全、轻率概括: XXXXXXXX 只是 XXXXXXXX 总集合中的一例, XXXXXXXX 不足以代表整个 XXXXXXXX 的现状,上述论证有”以偏概全”的嫌疑。
- 数字谬误:论述者通过 XXXXXXXX 这一平均数字,得出结论。该论证过程有待研究,因为平均数只能说明样本总量的总体特征和集中趋势,并不能代表每一个样本的具体情况,可能 XXXXXXXX 恰恰就在平均水平以下,因此该数据对其结论的支持度是有限的。
结尾:综上所述,该论述中存在诸多问题,所以上文作者的出的结论,是不足为信的,该论证也是严重缺乏说服力的。
逻辑反驳案例
调查表明,经常小憩(指的是工作期间偶尔离开办公室10分钟)的人,患癌概率比从不离开办公室的人多41%
分析:这是因为小憩的人,很多是去抽烟,而不是小憩本身导致患癌
一些统计案例
问:统计资料表明.大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全? 答:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。
问:统计数字表明,在亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病? 答:正好相反。亚利桑那的气候对害肺病的人有好处,所以肺病患者纷纷前来,自然这就使这个州死于肺结核的平均数升高了。
更好的例子:大医院的死亡率高
问:有一个调查研究说脚大的孩子拼音比脚小的孩子好。这是否是说一个人脚的大小是他拼音能力的度量? 答:不是的。这个研究对象是一群年龄不等的孩子。它的结果实际上是因为年龄较大的孩子脚大些,他们当然比年幼的男子拼得好些。
问:常常听说,汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢? 答:不是,统计只不过反映了人们往往是在离家不远的地方开车,而很少在远处的公路上开车。
问:有一项研究表明其一个国家的人民,喝牛奶和死于癌症的比例都很高。这是否说明是牛奶引起癌症呢? 答:不!这个国家老年人的比例也很高。由于癌症通常是年龄大的人易得,正是这个因素提高了这个国家癌症死亡者的比例。
有人在微博上说:“男人比女人更耐寒!”。原因是最近一周淘宝销售女式羽绒服18万件,男士不到6万件。女式均单价358元,男装比女装均价略低10来块钱,你觉得这个结论怎么样?这样的推断错在哪里了?
1:女性消费者在淘宝上购物可能更多或者说更加热衷淘宝购物 2:在选择羽绒服这件事情上,男性可能更加喜欢实体店购物 3:不可忽略的是选择女士羽绒服中的用户多少是男性?是否有送情侣或者爱人的情况,这样就分析不出男人比女人更耐寒。 4:女性可能1个人买N件,不理性。 5:男人可以穿一件羽绒服穿好多年。。也不一定要年年买的。 6:羽绒服只是保暖的其中一个工具,还可能有其他保暖产品销售,最后取加权平均。 7:那些女装有可能是男人买的… 8:只是最近一周的而已不具代表性 9:男装销量不如女装可能是由于男装的款式非常陈旧而女装的款式新颖,所以女装的销量比较大。 10:男人过冬不常穿羽绒服…穿风衣
论据搜集
1、有人花了200万美元研究出可以在太空写字的“太空钢笔”,小学生问:为什么不用铅笔呢?
有人花很多钱检测流水线上的空箱子,农民问:为什么不用风扇呢?
有时新人会问出一个“自以为很高明”的问题,让专家目瞪口呆。这往往并不是因为新人的问题真的一针见血,而是它本身就是一个显然错误的问题,从而长时间不在专家的视野中。
2、 “神经网络的本质不过是初中生都会的复合函数”、“人类文明的本质是烧开水”、“火箭的本质是大一点的二踢脚”,人类的本质是一堆原子,《西游记》的本质是几千个汉字排列组合,。
- 说这种话的人,一般称之为“Trivializer”,他们喜欢给不平凡的事物强加一个平凡的解读,还美其名曰「本质」。他们的解读并不能解释神经网络惊人的优点(拟合能力、泛化性),反倒是洋洋自得、大肆批判,“看!我窥见了本质!神经网络不过如此!”
不,你没有窥见本质。 - (哲学家)周濂:“我有一个朋友,喜哲学好思辨,最常用的口头禅有两个,一为“不就是”,二为“又怎样”。这两个说法看似平凡无奇,其实杀伤力超强,前者消解一切理论差异,后者取消所有行动意义,双“枪”在手,连环出击,无往而不利。”
这种试图给各种复杂的理论找一个庸俗化的所谓“本质”的行为,大多数情况是因为他们只能理解那些相对简单的概念“本质”。实际上,他们很可能连“本质”都不能真正理解,说这种话的人有很大可能既不懂神经网络,也不懂复合函数。 - 凝聚态开山鼻祖 Philip Anderson 的雄文 More is Different:这种想法的主要谬误在于还原论假说从来都不意味着“建构论(constructionist)”假说:将所有事物还原为简单的基本定律的能力并不意味着从那些基本定律出发并重建整个宇宙的能力。这个层级结构并不意味着学科 X “仅仅是Y的应用”。每个新的层级都需要全新的定律、概念和归纳,并且和其前一个层级一样,研究过程需要大量的灵感和创意。心理学不是应用生物学,生物学也不是应用化学。
《知乎周刊:日常经济学》
一个统计学案例
你决定用20/20 ratio来衡量收入不平等的程度 结论:一些有相同功能的指标,是没有可比性的 算法1:
- 你决定用所有人口的20/20来计算
- 如果没有收入的少年儿童人口多于20%,那么无论成年人的收入如何平均,不平等指数都会无穷大
- 这个算法假设所有人的收入不相等都叫做收入不平等
算法2:
- 剔除老人与小孩
- 大量的家庭,既有人计入了前20%,又有人计入了后20%。在一些女人主流做家庭主妇的国家,这个数字会无限大。实际上这个指标是家庭收入不平等指标
- 假设所有劳动力人口的收入不相等都是收入不平等
算法3:
- 剔除无收入人群
- 也剔除了失业人口,不合理
算法4:
- 按家庭总收入
算法5:
- 按家庭平均收入
- 问题:。。。
一个计量经济学案例
【一个图,横坐标是民主,纵坐标是GDP】
中国和印度都是outlier,然而这两个国家人口占到40%
问题在于,每个国家作为一个样本
如果按照人口回归,将会得到一个向下的直线(幸好这个回归不显著)
一个关于廉租房的因果链条
从茅于轼的“廉租房不提供厕所讲起”
- 从最简化的经济学模型看到,去除厕所可以有效筛选掉不匹配的需求
- 然而狭义的经济学规律在现实中不容易成立。社会不是由一群经纪人组成的,每个人都是有血有肉的人。减少一个厕所带来的人格和尊严损害可以通过其他通道转化为社会成本
- 美国五六十年代大规模兴建过廉租公寓,最终导致犯罪率和精神疾病发病率明显高于其他社区。现在美国做法是通过补贴方式在其它社区混入低收入群体,帮助低收入人群融入主流社会。尽管资格甄别有成本,但依托于信用体系,成本是可控的
另一个因果链条
假设廉租房200元,其市场价为1000元。
- 造成800元的套利空间,租下200元的廉租房,以999元租出
- 为了避免这种情况,政府介入。
- 如果开具虚假证明和行贿风险小于800,那么一定有人这么做
- 政府加大投入,增强纪检手段
- 加大虚假证明的打击力度
- 高薪养廉
-
即使做到天衣无缝,贫困人家为了800元收入,申请廉租房后,将其转租出去。最终贫困人口的住宿问题没有得到解决。
- 无厕所、小门、不接入有线电视等,实际上是降低了廉租房的市场价 (类比价格歧视)
《逻辑思维简易入门》
(这本书暂停,因为知识密度不如看国考行测) 【美】加里·西伊
一、推理的构成
分为 形式逻辑 和 非形式逻辑
- 其中形式逻辑又叫做符号逻辑,从作为公理的公式推导定理,它发展出了自己的形式语言。它不同于日常生活中的推理。
- 我们说的“逻辑思维”通常是非形式逻辑
为什么需要逻辑思维?
- 想要避免虚假的信念,尽可能拥有更多的真实的信念,这些信念之间都是以逻辑的方式相互关联的。
- 从对知识的好奇心来说,逻辑思维本身是一件值得投入的事情
- 逻辑思维能帮助我们在现实中充分推理。
陈述是论证的构件,陈述要么是真的要么是假的,只有可以表达信念的句子才能做陈述。
步骤
- 识别是否是论证
- 如果是论证,找到前提和结论
什么是论证
“推论”是一个或多个信念对另一个信念的支持关系,“论证”是一个或多个陈述支持另一个陈述的关系。
二、 用逻辑思考,用心说话
三、信念的优点
四、论证分析的方法
五、评估演绎论证
六、归纳论证分析
七、论证失效的主要方式
八、避免无根据的假定
九、从不清晰语言到不清晰推理
十、避免不相干前提
十一、符合命题
十二、检查命题逻辑论证的有效性
《赤裸裸的的统计学》
1、过分简化的描述性统计学 :巧合发生,只是引导人们去调查,而不是得出确定的结论
【案例】
亚特兰大某人2008年中了100万美元彩票,2011年又中了100万美元彩票。该事件概率是25万亿分之一,但我们不能仅凭次将其以诈骗罪关进大牢,而是可以调查一下他是否有亲戚在彩票公司工作。
【案例】
吸烟是否有害健康?统计20年后聚会同学的健康状况并不能帮我们研究。
1、吸烟导致的疾病使一部分同学无法去聚会
2、吸烟的原因导致的另一个结果(例如自律性差导致贫穷、酗酒),而这个结果导致样本偏斜
【案例】
血液中某些元素超标,觉得世界末日来了
– 只看到绝对的数字,而没有比较
– 虽然有比较,但没有均值的标准差
精确与准确是有区别的
【案例】
以下两句话可能同时发生
“有6成学校的成绩下滑”,“有八成的学生成绩上升”
“30个州的收入下降”,“70%美国人收入上升”
【案例】中位数与平均数
平均数谬误:“这项减税政策覆盖1亿美国人,人均减税1000美元”,实际上中位数可能只有100美元
中位数谬误:“这种新药把绝症的半数寿命延长两周”,因为右偏使得平均值远大于两周
【案例】百分比也会骗人,会让数据夸大其词
“结核病疗养院的费用增加了500%”:其实很少
“军费开支增加4%”:其实很多
饮用水中的砷含量降低22%:实际上几乎没有变化
【案例】
好医院的死亡率远高于小诊所
用死亡率作为指标将导致医院拒诊
2、回归分析的缺点
- 只能看出相关关系,不能看出因果关系
【案例】中国之树
3、相关系数
【案例】
“学生的成绩与家中电视机的数量成正比”
并不是说买5台电视机放到家里,学生的成绩就提高了。
而是受过良好教育的父母更有钱买电视,受过良好教育的父母孩子成绩更好
【案例】DNA测序
FBI说第9号染色体吻合的概率是千亿分之一,实际上全美国罪犯超过1000对吻合,这是可能因为:
- 人类之间的染色体本身具有相关性
- 染色体与犯罪有相关性
【案例】错把不独立认为相互独立
“灾难发生后,去超市买水就行了”:实际上灾难发生后,超市的水早被洗劫了
“飞机4个引擎全快的概率,是1个坏概率的4次方”:实际上4个引擎不是相互独立的
“Var风险控制”:实际上金融危机时,所有机构都受冲击,而急于卖出其它资产
【案例】错把独立事件任务不独立
篮球投篮中的“手感”并不存在
抽样误差
- 总体中的个体没有以相同的概率被选入与样本
- 《文学文摘》预测兰登打败罗斯福
- 医学领域:单纯对比AB两种治疗手段的康复率,一般来说意义不大。
影响思维的几个偏见
- 发表性偏见 你是研究员,你发现A对B没有关系,基本上无法发表。如果你发现A对B有关系,你基本可以发表。因此杂志上否定性结论远远少于肯定性结论
- 记忆性偏见 患癌者总是倾向于更多回忆自己不好的生活习惯
- 幸存者偏见
- 一个学校每个年级的平均成绩越来越好,是否意味着是好学校?不一定,可能每年都有人辍学
- 共同基金业绩看起来比较好,因为不好的已经死了
- 维生素实际上没用,但统计数字表明按时吃维生素的人更健康。答案:按时吃维生素的人更关注健康.同样道理,紫色睡衣对婴儿大脑发育没有影响,但刻意注意睡衣颜色的父母与那种不管的父母不是一类父母。同理还有喝菜汤的人更加健康。
中心极限定理
统计推断和假设检验
南加州的琳达女士被闪电击中4次,概率只有60万分之一,但保险公司不能因此认为她诈骗.因为只是统计学意义上的结果。
第I类错误和第II类错误:
-
垃圾邮件过滤,漏收一份重要邮件的损失远远大于未能屏蔽一个广告。因此更倾向于第II类错误最小化
-
癌症筛查 因为第I类错误是致命的,所以更倾向于第I类错误最小化
-
打击恐怖分子
你的概率计算不对,这对于黑天鹅事件更为要命:
【案例1】金融公司计算 Var 值,其基础上以为各种事件是相互独立的,然后相乘即可得到这个概率。08年金融危机,房屋违约变成了相关事件。
【案例2】飞机上引擎坏掉的概率是十万分之一。如果你是安全官,认为装上2个引擎,坏掉概率是相乘,那你就应该辞职。因为它们不是不相关事件:有可能一群天鹅撞向飞机,导致同时损坏。又例如天气、维护不当,当一个引擎坏掉时,另一个引擎坏掉的概率绝对大于十万分之一
【案例3】 婴儿猝死的概率是亿分之一,某人三个婴儿都猝死(计算得到的概率极低)被判为谋杀,实际上是这个人有基因问题。
【案例4】1)犯罪现场DNA与张三的DNA吻合,2)DNA样本与非本人吻合的概率是百万分之一,你认为张三有罪吗?你不应当投赞成票,
相关关系不等于因果关系
- 统计表明,自闭症儿童的父母比较冷漠,因此父母的冷漠导致了自闭症。
- 因为患者的父母倾向于回忆自己的冷漠,以找到原因等
- 某种遗传物质既导致冷漠又导致自闭症。
《统计数字会撒谎》
- 抽样误差:方法本身的误差,以及样本量太小造成的误差
约翰斯*霍普金斯大学有1/3的女学生嫁给了大学老师!实际上,该校总共只有3位女学生
-
抽样框误差:目标总体与抽样总体不一致 总体中的每一个样本,是否有相同几率被选入?
-
计量误差 物价指数的平均方法
- 回答偏差:包括有意不回答,无意不回答,回答偏差
调查问卷统计年龄时,35岁远远多于34岁和36岁。这是因为人们回答时,往往取5的倍数
为征兵的年龄普查,为获取救济的年龄普查,结果有很大差别
-
统计口径不一致
-
忽略基数
“早上开车生还几率是晚上的4倍,因为晚上事故比早上多4倍” 这可能仅仅因为晚上开车的人更多
类似的谬误: “天气晴朗时驾车比有雾更危险,因为…” “去年飞机事故的死亡人员比1910年多”
- 因果关系 从统计结论中得出因果关系的过程中,要特别小心
因果无关 因果倒置 存在它因
案例:跳蚤与健康
- 玩弄图形 数字相差两倍,可视化展现时,用半径相差两倍,给人的视觉感受差4倍(用圆)或8倍(用球)
其它
- 某城有两家医院,一大一小,某医院出生的婴儿有60%是男孩,请问更可能是哪家医院?
- 答案:小医院
- “无证据表明母乳有优势”与“证据表明母乳无优势”的混淆。
- 同样“没有发现阑尾的用处”,“人体不能吸收膳食纤维”
-
某车辆导航类APP统计研究称,女司机开车水平更高,这是因为男司机的刹车和油门更多,而女司机开车更稳 答案:有一部分性格粗心的女司机,在注册账号时,性别填的是默认(男);特意修改这一项的女司机是心细的那部分。
- 星巴克反对新的移民政策,因为可以拿难民补贴,美国高科技企业反对新的移民政策,因为可以雇佣低价外籍程序员,美国高校反对新的移民政策,因为通过特殊渠道录取外国高官子弟可以带来大笔收入,一切都是利益,打着冠冕堂皇的幌子,这个世界如果不是自媒体,还真让他们把持住舆论了
- 答案:一个主张对不对,归根结底看这个主张本身,而不是帮派或动机。亚当斯密写国富论就是为了自己所代表的资本。
- 动机决定正义。歧视。“XX是前人的做法,XX是国外的做法”。这些都是人类为了应对信息不对称而引入的贝叶斯推理方法(类似某种信用背书)。一个比贝叶斯推理更好的方法就是让信息变得对称,深入理解信息本身。(知其然,知其所以然)
《数据造假理论》
2014年成书,以温室气体测量统计为载体,1954年的《How to lie with statistics》未进行系统研究,且已经跟不上新的监管要求,需要改进。
定义、原则、范围
完整的数据造假活动包括:
- 原始信息采集与评估;
- 造假方案设计;
- 假数据生成;
- 采集有偏的原始数据(如使用错误的统计方法获取原始数据);
- 利用有偏的原始数据(如使用不完整但正确的原始数据);
- 伪造或篡改原始数据;
- 对原始数据进行有偏的解读或计算,得出存在倾向性的结果
- 报告。
广义上的“数据造假”是指“利用某种手段,使得依赖该数据所作的决策可能因为此行为得以变化或修正,实现操作者的主观企图”。
数据造假的基本原则有三个:
- 收益最大化——在不考虑风险等因素的前提下,造假者需按照自身需要权衡造假成本和数据调整所带来的收益;
- 风险最小化——使假数据难以被识别,最终作为真实的数据而被使用者或第三方接受;
- 责任最小化——即使假数据被使用者或第三方识别出来,作假者也无需承担任何责任。(责任最小化可通过技术、法律和制度层面的一些手段来实现:)
- 在技术层面,充分利用客观因素实现数据的偏移,例如选择不恰当但符合政策要求的技术和方法应用在数据的收集、处理和深度挖掘(解读)中,造成歪曲事实的次级资料,这种情况属于技术性失真;
- 在法律层面,由于有些法律条款过于笼统和原则,粗疏有余,细密不足,导致法律的操作性和执行性较差,造假者不会受到惩罚;
- 在制度层面,数据造假者可从政府部门会发布的各种具有权威性的数据和政策文件中选择对自己有利的信息加以利用,或者与政府利益相捆绑,此做法不仅难以被认定为主观上的造假,还可以强制使用者和第三方接受此类数据。
历史回顾
- 西方国家:制度完善,造假风险大,因此造假较为隐蔽。由于造假起步早,因此某些手段已经公开化和合理化。
- 苏联:使用各种专用统计数据规避造假问题。
- 民主德国:使用各种系数调整、创造新指标规避造假问题。
下面总结 《How to lie with statistics》 提供的造假手段
(1) 内在有偏的样本
通过在统计方案中设置误差,进行有选择的抽样,这样就得到了有偏的样本。有偏的样本对数据使用者来说不具有代表性(无使用价值),但是可以实现数据操作者的主观企图。此做法的巧妙之处在于一方面并未违背统计的透明性原则(统计方案公示,调查过程公开);另一方面依照同样的统计方案开展工作,保证了样本收集的一致性,单纯从统计结果上看难以发现问题。
评价:
制造内在有偏的样本,有两个主要难点:(1)如何在统计方案中隐蔽的设置 误差;和(2)误差的修正——例如今年统计口径变了,取得了预期的结果,但是明年依照同样的统计方案就很难再获得令人振奋的数据了,因此需要采用更巧妙的手段在明年统计中把今年误差修正回去。
(2) 精心挑选的平均数
由于不同类型的数据在分布上呈现不同的特点,而分布特征无法从(算术)平均数中得到,因此平均数无法完整的反应统计样本的真实情况。对于数据操作者来说,对平均数的利用属于有偏样本的进一步加工,最终得到所期望的结果。
评价:
《How to Lie with Statistics》中利用平均数歪曲事实的案例在 21 世纪已经是过时的做法。在中国即使是受教育程度不高的群体,面对很多平均数时也会指出自己“被平均”了,并要求提供更多的信息如众数和中位数等。
然而,对于采用优良做法得到的平均数,即使提供完整的数据分布图,其中的问题也难以被发现——这是因为那些自认为“被平均”的人根本就没被纳入统计范围内。所以平均数的制作比解读更有技术含量。
(3) 没有被披露的数据
选择符合数据操作者主观企图的小样本数据,并隐瞒样本量过小这一问题,这样就将缺乏代表性的结论包装成了具有科学性和充分性的事实。或者,隐瞒关键问题,通过发布不完整的信息和根据这些信息得出的结论,而误导数据使用者去接受另一种结论。例如 1948 年一些电力公司的广告中描述“今天,超过 3/4 的美国农场接上了电……”但“接上”并不意味着所有这些农场已接通了电,只能说明电线从那些农场经过,或铺设在离农场技术或上百英里的范围之内。
评价:
利用信息完整性进行数据操作可取得相当好的效果,但也是数据造假中最难的手段之一,需要操作者具有高超的水平。这是因为随着社会发展,很多法律、标准、规范或指南文件逐步完善,文件中的条款对数据的统计范围和收集方法提出了明确的要求。数据操作者需要调研海量的文件,并对其中的每个条款进行深入分析、研究,再结合自身情况发现其中潜在的漏洞。然后,通过 偷换概念、使用虚假或预期理由、循环论证、利用语词歧义 等手段,曲解条款或使条款无效化。
不管是财务审计还是能源的 MRV,核查证据的完整性和充分性对核证者来说都是有挑战的,所以利用信息完整性进行数据操作具有很好的欺骗性和隐蔽性。
(4) 毫无意义的工作
在统计数据中不可避免的会包含一些随机误差,在对比不同数据的大小时,有时难以评价一些微小的差异是否是随机误差导致的。但是根据这些微小的误差而下定论,可以起到夸大甚至歪曲事实的效果。
评价:
理解原书中的此章节需要读者具备一定程度的数理统计知识。
(5) 令人惊奇的图形
对于统计图形,改变横坐标与纵坐标的比例关系,就可以制造出客观性幻觉,得到看似很理想的数据增长或下降趋势。而且由于改变图形的比例关系并不影响数值的大小,因此不存在任何的伪造。
例如,虽然两个产品之间只有 5%的性能差距,但是通过改变横坐标轴的跨度,可让 5%的差异产生 50%的效果。
另外,更隐蔽的一种方式是省略部分坐标轴,并在图形上标注实际数据而不是比例
评价:
通过图形来营造客幻觉的方法常见于各种媒体。由于图形的使用者是缺乏专业知识又没时间仔细分析数据的普通大众,因此往往能起到很好的效果。
(6) 一维图形的滥用
使用形象图形比较两种或两种以上事物的具体数量时,在一维空间(如柱状图的高度)上按照比例来描述物体数量,但在二维空间(也就是图片)上画出一个三维物体。由于三维物体的体积与长度呈三次 方的关系,因此若某物体在一维长度上被放大至 n 倍时,其体积相应的被放大到 n^3倍(面积则是 n^2倍)。
评价:
这种视觉欺骗方法并不能改变数值大小,目前已不流行。
(7) 不完全匹配的资料
将收集到的原始数据与看上去极像,但其实无关的信息相混淆,得出支持数据操作者所期望的结论,这种挂羊头卖狗肉式的数据分析方法与利用信息完整性造假的手段相似,但更侧重对原始数据的解读。
评价:
利用不完全匹配的资料对事实进行歪曲的做法,在社会各领域都有广泛的应用。数据操作者可以阅读《How to Lie with Statistics》原文,以获得更多的参考案例。
(8) 相关关系的误解
两个事物之间在数量上呈现出一定的相关性,但这种情况并不能用于说明其中一个将引起另一个的变化。数据操作者利用混淆相关关系与因果关系,可以对数据进行歪曲的解读。
评价:
混淆相关关系与因果关系,属于“怎么用统计数据说谎”的范畴,而不是怎么做假数据,因此本报告不再做过多介绍,读者可以阅读原文以获得更多信息。
(9) 如何进行统计操纵
《How to Lie with Statistics》原书中在此章介绍了很多案例,介绍了统计数据是如何被歪曲的,进一步丰富了数据操作的参考资料。
评价:
原书此章所介绍的一些案例也可归类于前面的章节。由此可见,对于数据造假方法,很难做到有条理的一一归类。虽然数据造假的各种方法之间存在很大相似性,但适用于实际情况时,方法的选择受到客观因素限制,难以形成固定模式。
3种通用形式
4种方案
数据造假选项方法 | 如何实现数据偏移 | 典型应用 | |
---|---|---|---|
Ⅰ.极值推算法 以最理想情况作为假设条件外推数据,用于数据的预测或估算。 | 使用看似合理的主观推断和真实客观的原始数据,有理有据的对数据进行歪曲的预测。 | 学术文献、专家意 见、目标规划、节 能技改项目的节能 量计算。 | |
Ⅱ.模糊边界法 对统计口径或计算方法进行操作,实现数据的调整。 | 造成统计范围上的差异。重复计算、漏算或在引入不匹配的数据。 | 对数据的采集与计算方法有书面文件要求的情况。 | |
Ⅱ-A.地理边界 在统计中使用不一致的地理边界,尤其是利用地理边界随时间 变化等客观因素偷换边界。 | 造成统计范围上的差异,使数据发生重复计算或漏算。 | 各类与能耗相关的 统计活动,尤其是 以企业法人为主体 的统计活动。 | |
Ⅱ-B.时间边界 在统计中使用不一致的时间跨度,或调整某个事件发生的时间。 | 造成统计范围上的差异,使数据发生重复计算或漏算。 | 各类与能耗相关的统计活动,尤其是对假技改项目进行包装。 | |
Ⅱ-C.双(多)重基准线 将不同基准线下的结果进行比较,得到错误的计算方法。 | 将不匹配的数据纳入计算中,得到无实际意义的结果。 | 在专业性较强的技术类文件中进行隐蔽的造假活动。 | |
Ⅲ.平衡调整法 某个数据人为调整后,对其他相关联的数据也进行修改,使各数据和指标均控制在合理范围内。 | 对整套系统中的数据进行操作,得到具有合理性和一致性的假数据。 | 可行性研究报告,环境影响评价报告,以及各种需要应对核查的情况。 | |
Ⅳ.模拟计算法 通过对真实数据进行分析,制造出以假乱真的符合造假者主观企图的假数据。 | 按照主观需求得到仿真数据。 | 真实数据难以获得或需要对真实数据进行大幅度修改的情况。 |
1. 极值推算法
例如,经济发展是S型曲线,但隐瞒后一段,理解成线性关系然后用直线(更过分的是指数)来回归预测。
极值推算法的必要证据清单 :
- 客观证据(A) : 使用易被核证的证据,直观的反映证据真实性。
- 假设(h)
- 使用具有权威性的证据,如从政府渠道发布的文件、国家标准、 可行性研究报告等;
- 证明假设(h)是行业的常用做法;
- 不宜在计算中引入过多的假设;
- 不宜引用学术性质的文献。
使用极值推算法时不宜提供以下信息:
- 隐含假设(h’)
- 客观证据(A)与结果(B)之间不呈线性关系的事实需要隐瞒。 与此事实相关的任何证据均不宜让审核方获得。
- 实际监测数据
- 假设(h)所覆盖的时间段内的任何实际监测数据均不宜让审核方获得,包括与能耗有关的定期记录、累积数据、工况数据等。
- 与结果(B)相关的财务证据根据本卷后文“模糊边界法”中的原则,减弱其时效性和匹配性。
- 对于其他存在关联性的,不利于假设(h)的证据,建议采用变更统计原则等手段使相关信息之间不匹配(不具备可比性)。
极值推算法需要提供的必要证据在四种数据造假的选项方法中是最少的,然而不宜提供的负面证据却很多。
所以,在使用极值推算法时,需要造假者(企业)设计并实施一套信息管理方案以确保核查人员无法获取负面信息。
累积偏差的修正
采用极值推算法后得到的结果与实际情况之间的偏差会越来越大,最终会导致结果严重偏离事实。需要数据操作者在不推翻现有结论的同时,对偏差进行处理。
读者需要结合自身实际情况,对累积偏差进行修正。常见的做法是对历史数据进行修正,例如降低历史数据以保持数据的增长趋势。使用这种做法有两个前提:一是修改的理由充分,二是数据提供者不对历史数据的准确性承担责任。
累积偏差的修正还可以结合本卷之后其他的数据造假选项方法,例如利用模糊边界法使历史数据不再具有任何意义,整个统计活动得以推导重来。
模糊边界法
模糊边界法是适用范围广泛的数据造假形式,通过歪曲调查的客体实现数据的偏移。此选项方法具有很高的隐蔽性,若灵活运用可以将数据造假的风险和责任降至最低的程度。然而在造假方案的设计中如何引入此方法对造假者的个人能力提出了很高的要求。
整理出了三种模糊边界法的数据造假形式,分别是模糊地理边界、时间边界(跨度)、和多重基准线法。这些选项方法的优良做法是:依托真实的原始信息,实现数据的重复计算、漏算、或将不匹配的数据纳入计算中,同时降低各个证据之间的关联性。
必要证据清单
- 文件依据
- 提供确定地理边界的文件依据,如政策或标准等;
- 在任意时间段,地理边界的确定依据宜保持一致。
- 符合性证据
- 证明地理边界的确定方法符合文件中的要求。
- 地理边界内的各种证据
- 提供足够数量的地理边界内的各种信息;
- 在地理边界已经发生变化的前提下,核查人员对边界内各种 证据的核查是无意义的。
- 能源消费的财务信息 (可选)
- 对于企业层面的 MRV 活动,尤其是涉及多厂区的情况,宜提 供宏观的能源消费信息,如能源外购记录,并且原始凭证中 不宜出现具体的位置信息。
模糊时间边界
模糊时间边界法通常用于财务数据的造假活动中。由于财务数据是离散的,且做帐的依据是人为制定的各种文件和公允做法,所以不管是责权发生时间还是收付实现时间都可以通过各种手段进行调整。
双(多)重基准线法
双(多)重基准线法是模糊边界法的一种特殊情况,
双(多)重基准线法的必要证据清单:
- 文件依据
- 提供数据计算或比较的依据,如政策或标准等;
- 优先使用有权威性的证据。
- 符合性证据
- 证明数据造假者的做法符合文件中的要求
不宜提供以下信息:
- 原始数据的定义
- 参与计算的每一类数据的详细介绍;
- 行业内的技术文献,尤其是教材性质的文献。
平衡调整法
平衡调整法就是在某个系统内,对部分关键数据进行调整以实现数据操作者的主观企图,同时还对体系内的其他数据也进行必要的调整,以满足各个数据之间的关联性。采用本选项方法的数据造假活动不仅需要遵守特定行业的专业技术知识,还需要使各个数据以及根据数据得出的结论在任何情况下都服从基本的数学和物理学定律(即必然的数量关系)。在造假方案的设计过程中,优良做法是尽可能减少或避免对原始数据的篡改或伪造。
平衡调整法在数据造假活动中的应用原则如下:
- 确保每一类型的数据内部保持平衡,各个指标合理;
- 特定类型数据完成平衡调整后,还要保证不同信息之间的一致性;
- 对于动态数据谨慎使用平衡调整法。
模拟计算法
模拟计算法是指根据数据操作者主观企图,使用各种手段,生成具有倾向性数据的一种做法。由于可能涉及真实数据的篡改或伪造,优良做法是提高数据生成质量,消除负面证据,必要时与平衡调整法联用。
倍率调整法 是采用一个或多个系数,对原始数据按比例的进行调整,此方法可以很好的保持数据之间的相关性。需要分析被调整量在整个生产活动中的敏感性,避免出现调整幅度过大的问题,并且要注意动态数据按比例调整后的方差变化问题。
干扰法 是对监测设备的数据采集过程施加影响,使其生成有偏差的原始数据。
失败案例:1. 核查发现,某厂某工序加入火碱前后,PH值不变。2. 某炉子拆除后,仍然有二氧化硫数据传来。
您的支持将鼓励我继续创作!
