《简单统计学:如何轻松识破一本正经的胡说八道》,江西人民出版社出版,作者是加里·史密斯,美国经济学教授。书籍原名Standard Deviations:Flawed Assumptions,Tortured Data,and Other Ways to Lie with Statistics,我不知道为什么中译者要像扭曲数据一样扭曲原义,不过显而易见的是这个译名更方便赚钱。按照我的阅读偏好,这本书的分类和我没法看对眼,大概率我不会翻开封面;从数据上,这是一本在豆瓣上由1600左右读者给出7.5分的书籍(即便这个评分和男足一样),也难以引起我的阅读兴趣。然而数据和概率的局限性就在这里,我读它了,理由是:它免费;那天阅读公众号在我无书可读的时候给我分享了它;我在kindle里做了笔记,不想半途而废。预期中的0%变成了100%,概率和统计不能决定什么,它是一种可能性。我写这本书的读后感不是因为它好看,不是因为它提供多少正向激励或情绪价值,纯粹是出于工具性考虑。
这本书用不精彩的文笔和不体谅文科生的阐述方式,介绍了数十个关于数据的案例,涉及幸存者偏差、自选择偏差、证实偏差、安慰剂效应等等思维谬误,其他缺点是案例重复性很高、分类上互相缠绕、过于放大常识的矫正作用,还有用错写错的成语。简单讲个幸存者偏差的例子:“有人对兽医院接收的从高层公寓楼坠落的115只猫进行了调查,发现从9层以及上楼层坠落的猫咪的死亡率为5%,从不足9层的楼层坠落的猫咪的死亡率为10%。根据医生的推测,这是因为从较高楼层坠落的猫咪能够将身体伸展开,形成一种降落伞效应。但这个数据并不全面,因为坠落后死亡的猫不会被送到医院,猫主人也不一定肯为从较高楼层坠落、救治可能性更小的猫花钱。”我们可以看到准确的数据是如何让人生产出错误的结论的。当然,案例不是重点,我感兴趣的是案例揭露的认知错误:第一个错误,容易被模式、解释模式的理论所引诱;第二个错误,寻找支持假设的证据而忽视或曲解与假设相反的证据。
多相信数据?多相信模式?多相信理论?很多人贪求数据就像流浪汉在暴雨天寻找一间屋子,轻慢数据就像忽视地铁里的广告牌,它们是工具,没有意志,即便我们拿数据给这个时代冠名,而被命名的往往是我们自己。很多人解构和质疑一切,父权制、沙文主义,对空气拳打脚踢但从来不会给数据剥皮。我们最常做的是根据数据进行分析而不是拷问数据的可用度、真实性,这其实是一种很可怕的惯性。数据之外,还有很多无法被量化的;类别之外,还有很多无法被归类的。数据不能表现我的疲累程度、我有多大概率在某一瞬间想砸坏播放闹铃的手机;而假设十二星座论真实可信,整个世界就只有十二种人,太简单也太安全了。完全相信数据是一种惰性,而相信一切可以被数据描绘则是一种傲慢。