新书：大数据如何识破谎言

得到“每天听本书”栏目解读了一本英文新书，名叫《人人都会说谎》，这是一本和大数据有关的书，作者赛斯·斯蒂芬斯·大卫德维茨曾经担任谷歌大数据科学家。这本书里提到了一个观点：无论是有意还是无心，每个人都可能说谎，他们可能在调研时掩藏自己真实的想法，他们的常识可能是错误的。最典型的例子就是2016年的美国大选民调，在大选前一天，希拉里还领先特朗普好几个百分点，大选结果却是特朗普反超。

作者解释说，美国人不诚实的回答可能导致特朗普的支持率少报了至少两个百分点，因为不少特朗普的支持者并不愿意在接受民调的时候说出自己真实的想法。这些不说出自己支持特朗普的人觉得，主流民意把特朗普包装成一个大嘴巴的笨蛋，自己如果公开对他的支持，就可能会被别人嘲笑。社会学中将这种行为称作社会期望偏差（social desirability bias），也就是人们会把自己非主流的想法藏起来，担心自己的想法跟别人不一样而遭到歧视。类似的例子还有很多，比如有人说喜欢读高深的书，其实更喜欢小道消息；有人声称自己喜欢文艺片，其实还是更愿意看火爆的商业大片。

那大数据是如何发现人们撒谎的呢？可以观察人们在互联网上的行为，那能更好地反映他们的倾向。还是拿2016美国大选举为例，其实，仅仅对搜索信息做一个梳理，就能发现特朗普获胜的苗头。比如说在特朗普逆袭的美国中西部几个州，民调都显示是希拉里领先，所以希拉里就放松了对这几个州的竞选投入。但谷歌搜索显示，搜“特朗普、希拉里”的人数，多于搜“希拉里、特朗普”的人。显然，如果你倾向于投票给谁，就更可能把谁的名字放在前边。

所以，大数据研究能告诉你一个更真实的世界，这是做出正确决策的第一步。如果希拉里团队能够更早认识到美国中部地区对大选相关问题搜索的研究，就可能加强在这些地区的竞选投入，意外落选的情况也就很可能不会发生了。

| 周一到周日，每天零点更新，全年无间断 |

Leave a Comment Cancel Reply