可别被极端数据忽悠了

现在大家都讲大数据,觉得大数据神乎其神。但有时候,如果你用错了数据,很有可能就被忽悠了。最近,科普作家蒋迅在科学网上写了篇文章说,我们就常被数据里的极端值给忽悠了。

讲个统计学小笑话啊。话说有一年,美国北卡州立大学地理系做了一次统计,看看毕业生的收入情况,结果发现,地理系毕业生的平均起步薪水,不光比其它专业高,还比其它学校的地理系都高。于是得出结论:要想起薪高,就得上北卡大学、上地理系。奇怪吧,怎么学地理的能挣着那么多钱呢?说来也简单,那一年北卡州立大学地理系毕业了一个学生,叫迈克尔·乔丹,就是当年NBA那位篮球之神,因为他一个人,拉高了整个地理系的平均薪水。

乔丹的工资在这儿就叫做极端数据,因为统计的时候把这个极端数据加了进去,所以造成了这种错觉。

这样的例子还有。很多人说:演员的收入那么高,而我们的科学家收入远不如这些演员,真是世风日下啊。但事实真的是这样吗?起码美国就不是,美国劳动部做过统计,如果排除极端情况,科学家的收入要远远高于演员,因为除了那些个别收入极端的名演员,绝大多数演员的收入状况其实并不理想。这也就是为什么,很多评选的时候,要去掉最高值和最低值,就是怕极端数据影响了判断。

所以你看,数据虽然有用,但可别被极端数据忽悠了。

本文源自:从一个与统计有关的笑话说起:地理系毕业生的起薪最高
为什么电影演员收入比科学家高那么多?
撰稿:李赟铎
讲述:杰克糖

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top