你好,欢迎来到《得到精选》,我是李南南。
今天的内容来自喻颖正老师的新课《决策算法100讲》。我们经常说选择大于努力,但问题是怎样做出选择呢?那当然是靠决策了。说白了,选择大于努力,本质上就是决策大于努力。
但问题是,需要做决策的事儿有那么多,不同的情况我们又应该怎样做决策呢?关于这个问题,喻颖正老师说千万不用担心,因为不管有多少种决策,他们都需要遵循一个最高原则,这就是期望值的最大化。
关于具体的方法,咱们就有请喻颖正老师来跟你说一说。来,有请喻老师。
你好,我是老喻,欢迎回到《决策算法》课。
上一讲我们讲了胜率和赔率,这一讲我们来讲期望值。期望值,是所有决策理论的基石,假如你想成为决策高手,这是你必须掌握的第一公式。
先讲个真实的故事:
每隔两年,巴菲特都要和一些好友到加州的水晶海滩打高尔夫球。有一年美国政府雇员保险公司的董事长拜恩提议小赌一把,如果有一个人能一杆进洞,他就输给每个人1万美元,如果没有,每人输给他10美元。所有人都同意参加,只有巴菲特拒绝了。
请问:为什么巴菲特不玩儿这个游戏?
在揭开谜底之前,先和你分享我自己的一个小故事。
我住在加拿大的温哥华,有天朋友一家来我们家吃饭,他突然想起来,自己没带驾照。他一会儿还要带女儿去上个补习班,于是就开始犹豫要不要回家取驾照。
他家离我家大约10公里,上补习班的地方离我家大约1.5公里。这个时候,我问了一下在场的几个朋友:你们谁在过去几年被警察查过驾照?大家都说没有。
我说:保守估计一下,被警察查驾照的概率,应该低于千分之一吧。我再保守点儿,就当被查的概率是百分之一,被抓住会被罚款214加币,所以你回家这一趟的价值,是214*1%=2.14加币。还不如油钱呢。
这里稍微补充一下,在加拿大不带驾照,只会被罚款,警察能上网查到你的资料,所以没别的处罚。
朋友一想,对啊,不如我留下来接着打牌吧。
我说服朋友的逻辑,就是期望值计算。
在概率论和统计学中,期望值是指在一个多次重复的试验中,每个可能结果的值乘以其发生的概率,再将这些乘积相加得到的总和。
概念有些绕,简单点儿说吧,拿抛硬币的游戏为例,假如游戏规则是每扔一次,正面的话你给我两块钱,反面的我给你一块钱,那么这个游戏对你而言,期望值是多少呢?
我们计算一下:硬币正面朝上的概率是50%,对应的价值是你亏两块钱,所以是50%*(-2),等于-1;反面朝上的概率也是50%,对应的价值是你赚一块钱,所以是50%*1,等于0.5,用-1加上0.5,得出的数值,就是期望值,算出来是-0.5元。
换个角度说,期望值就是,“你获胜的可能性乘以每次可能赚取的金额”,减去“你失败的可能性乘以每次可能损失的金额”。
期望值有啥用呢?上面的简单公式,可以告诉你,假如你一直重复玩儿很多次这个游戏,你平均每把能赚多少钱或是亏多少钱。
当我们做决策的时候,期望值可以作为量化的依据,来评估一件事情未来的收益。
回头看开头的故事。为什么巴菲特不愿意下注?因为那是一个负期望值的游戏,不值得参与。
根据统计数据,业余球员一杆进洞的概率是1/12750。拜恩开出的赌局,对巴菲特而言期望值的计算是:(10000/12750-10)=-9.22
不出这十块钱,可以理解为巴菲特在概率上的洁癖。任何下注,都需要严格的纪律。要做到这一点,很多时候是反人性的,极其不容易,像所谓童子功一样破不得。
有意思的是,期望值这个概念第一眼看上去特别简单,用小学三年级的数学就能解释。
但是,只要稍微复杂一点儿,人就容易晕掉。别说你,就连那些名校毕业的华尔街精英都会犯迷糊。
有次,《黑天鹅》作者塔勒布去参加纽约市的专业交易员的内部研讨会,有人问他怎么看股市,他说:我相信下个星期,市场有很高的概率会略微上涨。
对方又问,概率有多高呢?
塔勒布说:大概70%。
这时,有个人坐不住了,插嘴说:嘿,塔勒布,你之前还在吹牛说你正在大量卖空股市,也就是说赌股市会下跌。你怎么又说上涨的概率高达70%,你这不是自相矛盾吗?
那么,塔勒布到底是怎么想的呢?原来啊,他的确认为下个星期市场有70%的概率上涨,30%的概率下跌。但是如果上涨,可能只会涨1%,要是下跌的话,则可能跌10%。
这意味着什么?
我们来算一下期望值,70%*1%-30%*10%=-2.3%,期望值其实是负的。尽管看起来下周上涨的概率更大,但是,根据期望值,押股市下跌更可能赚钱。
说到这儿,我想引出一个特别重要的观点:
期望值的大小,比胜率的大小更重要。
我们平时经常会听到一句话:我们要坚持做大概率成功的事情。——这句话其实错了!
我们坚持要做的,是正期望值的事情。
太多人混淆了胜率和期望值。人们偏好于看起来最可能发生的事情,也就是概率更大的事情,但是却忘记了,我们要考虑的,是概率乘以对应的报酬,也就是期望值,这才是我们真正在意的回报。
比输赢更重要的,是输多少和赢多少。
正因此,索罗斯说过:“对错都不重要,关键是弄错的时候你损失了多少,判断正确的时候又赚了多少。”
有些高胜率的事情,极可能期望值是负的,也不能参与。就像上面说的塔勒布的故事。
我们在日常生活中做决策的时候,尤其是涉及到钱,一定要坚持去做正期望值的事情。类似于彩票、赌博、抽奖,其实都是负期望值的事儿,不值得参与,这一点我们后面课程会讲得很详细,这里只举一个小例子。
很多地方有一种抽奖游戏,花一块钱就能抽,奖品很大,比如价值1万的高配iPhone。有人可能会说了,一块钱而已,不抽白不抽,以小博大嘛。
我们来算算期望值,假如100万人,去抽20部iPhone,你抽中的概率是五万分之一,假如iPhone值一万块,你抽一次对应的“报酬”,是一万块的五万分之一,也就是两毛钱。
所以,看起来你付出一块钱很少,但你其实是拿一块钱去买两毛钱的“报酬”,期望值是负的八毛钱,这明摆着吃亏,哪里有什么以小博大呢?
如果你不去追求正期望值的事情,总指望中大奖,基本上最可能的结果是:你会穷得很稳定。
当然,假如你是商家的话,你可以设计一些类似于彩票的游戏来赚钱。哈佛早年就靠卖彩票盖了两栋大楼,至今仍在使用。
听到这里,学过一点概率论的同学可能要说,老喻,这我早知道,你能不能讲点儿更烧脑的啊?
让我们来做一道题:
你有一套房子,价值100万。有个大富豪对你说,来,你用房子下注,和我玩儿一个抽奖游戏,一共有五张牌,其中有个黑桃K,假如你抽中黑桃K,你能拿到1000万。
你要不要玩儿?
这是一个对赌游戏,如果你赢了,不仅能拿回房子,还能赚到1000万。
算一下期望值是1000万*20%-100万*80%=120万,看起来相当可以,当然应该参与吧?
慢。
你到底要不要去赌,还取决于你是否输得起这套房子,以及这个游戏能够重复多少次。因为虽然期望值是正的,但是极有可能,你还没实现期望值,已经把房子输掉了。假如你只有一套房子,你怎么承受得起呢?
从脑筋急转弯的角度,你应该拉上四个朋友,你们五个人同时抽,一人抽一张,用500万赌注换回大富豪的1000万,外加抽中的那个人的房子(价值100万),然后大家一起平分净赚的600万,每人能分120万。
我举这个例子,是想引出一个跟期望值一定要同时使用的特别重要的概念:
遍历性。
遍历性(Ergodicity) 是一个统计物理学和概率论中的核心概念,简单来讲,就是一个系统中所有可能的状态是不是都被实现了一遍。
我们再回顾一下“期望值”的定义,期望值是在重复很多次的游戏中,理论上“预计”每次操作平均带来的净收益。重复越多,平均结果越接近于期望值。
记住,是重复很多次的之后的平均结果。就像上面大富豪和你玩儿的抽扑克牌游戏,虽然算下来期望值是正的120万,但是并不代表你每次都能赚到120万,大部分情况下,你会输掉自己的房子。
你要么一个人重复抽很多次,要么找几个人和你一起,同时把五张牌抽完,才能实现遍历性,从而得到正的期望值。
这意味着一个严峻的现实:即使你找到了一件期望值为正的事情,你也可能在实现“期望值”之前破产,就像上面,还没赢到一千万,你已经输掉了自己输不起的那套房子。
所以,你必须在游戏里坚持足够长的时间,实现遍历性,这样,从长期的角度你是稳赢的。
期望值告诉我们,永远只参与整体期望值为正的游戏。
而遍历性揭示了一个重要的现实:即使期望值是正的,也需要足够多的重复和耐心才能实现。
如果你无法支撑到那一刻——比如在抽中黑桃K之前失去了房子——期望值再高也无济于事。
你看,平时我们喜欢说长期主义,说无限游戏,但是不是要弄懂了背后的数学原理,才算真正懂了?
的确,我们应该把期望值的计算,当作决策的基本原则之一。
而在人生当中,我们不仅要努力找寻那些期望值为正的机会,还要想办法重复那些机会,才能让期望值从一个数字变成我们实实在在的回报。
在这一讲的最后,我想根据今天的内容,送给你一个“期望值决策工具箱”。
当你用期望值计算做一个决策的时候,问自己以下三个问题:
问题1:我是否被高胜率诱惑而忽略了低收益?
问题2:我是否被高收益诱惑而忽略了低胜率?
问题3:我是否有足够筹码多次重复下注,支撑到正期望值实现?
以上就是这一讲的全部内容。
好,内容听完了。
现在,喻颖正老师的《决策算法100讲》,已经开始正式更新了。现在订阅,还可以获赠一份《决策工具手册》,里面包括54个简洁的决策模型,非常实用。
假如你对这门课感兴趣,那么现在在得到首页搜索“决策”两个字,就能看到喻颖正老师的《决策算法100讲》的订阅入口,推荐你现在加入。
好,以上就是今天的内容。《得到精选》,明天见。