信息科学家杰文·韦斯特(Jevin West)和生物学家卡尔·伯格斯特龙(Carl Bergstrom)在华盛顿大学开设了一门新课,课程的名字叫做“在大数据时代拆穿胡扯”(Calling bullshit in the age of big data)。韦斯特和伯格斯特龙认为,人们很容易就能识别出口头上的胡扯,毕竟我们已经使用语言数千年了,但数据和图表是19世纪80年代才流行起来的。由于数据呈现出的复杂性和准确性,很容易高效地伪装成胡扯的信息,让人上当受骗。
伯格斯特龙说,想要拆穿数据的胡扯也很简单,不需要你获得统计学学位,需要的是一些常识和思维习惯。两位教授提供了一些建议:首先,看到一则信息时,你可以问自己三个问题:谁告诉我的?他是怎么知道的?他想向我兜售什么?其次,如果一个数据看起来特别好,好的都不那么真实,那很可能就不是真的。尤其是那些和你的个人观点或者经历十分一致的结论,特别值得怀疑。第三,警惕不公正的比较。比如,有人告诉你,观看特朗普就职典礼直播的人数要比看奥巴马就职直播的人数多,那是因为2017年看直播比奥巴马就职那年容易多了。第四,要知道机器也可能有偏见。比如,用来预测个人犯罪行为的计算机模型对少数族裔表现出了偏见,很有可能是因为用来“训练”算法的数据反映了现有的文化偏见。机器和给他们编程的人一样容易犯错,而且不会因为感到内疚而纠正自己的行为。
|周一到周日,每天零点更新,全年无间断|