当前位置: 首页> 书评> 正文

统计数字会撒谎《统计欺骗的艺术》

  • 小小评论家小小评论家
  • 书评
  • 2023-03-26 11:26:41
  • 23

最近豆瓣上拿到了一本书的试阅稿。。。统计数字会撒谎,书里描述了种种打着科学旗号利用统计数字进行欺骗的行为.

由于知识信息和地位的不对称普通人在面对行业精英专门设计的陷阱总是无法防备.就像普通美国民众无法理解华尔街"金融天才"搞的次级抵押贷款的潜在风险一样...恩不光是普通人就连中石油这样的顶级上市公司在顶级ceo的带领下也会中套油价顶点超高价大笔收购国外油田例如TYK之类的...

信息欺骗有很多种而利用统计数字来进行欺骗可能是比较普遍的了就像马克吐温说的There are three kinds of lies: lies damned lies and statistics.这本书就是揭露说明专家们的欺骗行为的.比如报社为了吸引眼球如何发布关于名牌大学毕业生高收入的报道***部门如何利用同样的原始数据算出不同的统计结果房地产为了卖房子如何统计出小区业主的超高收入一般人如何误读智商测验的一般统计结论大公司的销售和市场部门如何用图形上的视觉欺骗来提高统计数字给人的感官效果广告商如何用不匹配数据对大众进行误导....

接着在罗列了种种利用统计欺骗的手段后书里描述了一系列方法和手段告诉我们在面对统计数字的时候如何去理解和评估那些数据如何揭穿有意或无意的统计骗局.

这本书的特色就是案例非常多用案例的好处是比较容易能理解缺点就是有的时候比较罗嗦有时候一眼就能看出问题所在书里还要花个几千字去描述他...好比那个经典的二维图形欺骗案例...

书里我最喜欢的一段是介绍平均工资偏高的案例,不过有些地方用词太学术了:“当数据的分布呈现正偏态时,均值往往偏离一般水平。。。收入分布是典型的正偏态分布,这样一来,平均工资偏高就十分正常了。。。"囧。。。这有优点像概率统计课程了。。。这个还不如我的解释通俗易懂:

假如有10个穷人工资是1块,1个富人工资是12块”,算术平均数的算法,就是22块除以11人,平均工资是2块。。。这个结果明显高于普通人“平均”工资.所以统计局平时说的大家平均工资有2k了,其实一般人是没有2k的,大家感觉偏高了,可是统计局可以言之确凿的说,这确实是某种统计方法算出来的

还有一种常用的统计方法我记得是平方平均数,计算方法是平方数相加后取平均,再开根号,用上面的例子就是(10+12*12)/11=1414开根号就是 3.7块.还有一种统计数值,调和平均数(將数值个数除以数值倒数的总和)算出来是1

我发现最夸张的是几何平均数算出来是11。。。

恩,然后情况就来了,类似上面10个穷人1块,1个富人12块的统计状况,统计局会决定用哪种算法,算普通人平均工资就会往高的算,就拿那个算术平均数2块来算吧,要不平方平均数3.7块。。。然后碰到垄断部门工资算法的时候,他会拿出调和平均数算法,说,你看,大约是1块,都很低么。。。穷得很,很阳光吧。。。

还有一种统计我看到过照片也很牛,是个调查问卷,选择是满意和比较满意。。。然后统计局会说,大约40%的人满意,大约50%的人比较满意。。。

书里讲到统计为什么会撒谎,原因之一是被调查的人是撒谎的,比如问你是不是刷牙你不好意思说你不刷。。。这个正如经济普查浙江地区很多人隐瞒财产一样...还有原因之一是调查的量不够多,分布不够平均等,这些都影响到实际的统计数据,比如最近hz号称gdp达到中等发达水平,就连我寝室那博士都信以为真,不过我看到那篇文章深处有一行字-不包含流动人口。。。hz自己宣称流动人口是有400w,常驻600w,gdp价值是无法区分流动人口还是常驻人口的,假设1个人创造了1k的gdp价值,按照hz这个算法,就是(400+600)/600=1.6也就是文字上动动手脚,人均gdp就被他算到了 1.6k。。。

还有一个比较有意思是视觉欺骗的案例,这个我看到销售做ppt显示销售量时经常用,其实只是1:2的增长关系,他画了个图,图像长宽都是1:2的话,面积就是1:4,这样你的视觉就会告诉你这两者区别远比1:2大。。。

书上讲了许多广告商欺骗的例子,比如“对著名医生的大样本调查结果显示:27%的医生抽的是xx牌子的香烟”。。。其实这个数据是虚构的,不过放个数字一般人就会感觉到很可信了。。。

还有就是上市公司的报表了,恩,都很狡猾,比如书里讲到,如果每天早上99块买来1个东西,100块卖掉,那只有1%的销售收益率,不过1年下来,他赚了 365块,成本只有100。。。这样他对外宣称很穷,赚的很少,其实通过各种名目的数据转换,隐瞒了很多利润。。。

继续往下看,这书就是一堆利用统计数字欺骗民众的案例集合。。。连载稿太短一下子看完了。。。

阅读全文