151|做高数题,AI是怎么从学渣到学霸的?

这里是《得到头条》,我是徐玲。

今天我们从两个话题出发,为你提供知识服务。一是考生吐槽2022年考研数学太难,二是脉脉发布《2021人才吸引力报告》。

先来看第一条,咱们从考研说起。考研的重要程度,正在接近高考。我给你说个数字:2021年全国高考考生是1078万人,2022年全国考研考生是457万人,也就是说,考研人数已经接近高考人数的一半。再来看录取率,2021年高考录取率为87%,而2022年考研录取率只有24%,考研的竞争激烈程度比高考要大得多。

目前,2022年考研笔试已经结束,分数还没有公布。很多考生反馈,今年的英语科目相对简单,政治科目比想象中难,但最难的是数学。有考生说,“70%的复习时间都给了数学,到头来还是当头一棒,感觉啥都不会”。还有人说,“感觉一年都白复习了,今年考完就觉得好像我没有学过数学”。可以说,在考研竞争中,谁能拿下高数,谁就能笑傲江湖。

其实,不光是普通人会觉得数学题很难,连人工智能在很长一段时间内都搞不定数学题。在一年以前,如果你给世界上最先进的人工智能出一道题,问它:五庄观里种了5棵人参果树,三千年一开花,三千年一结果,再三千年方得成熟。一万八千年后,一共结了多少个人参果?这个问题,人工智能大概率回答不出来。当时的人工智能解答这种文字表述的数学题,还处于小学生水平。

不过,彭天放老师告诉我,就在最近,人工智能突然开窍了,做数学题的能力直接秒杀理工科大学生。这是怎么回事呢?来看看新一期的硬科技报告。

1月4号,麻省理工学院等四所高校的联合研究团队,发布了一项最新研究成果:他们开发的神经网络程序,可以解答出微积分、线性代数等大学数学题。不管是要求计算数值,还是写方程式,或者画出函数图形,都是手到擒来,正确率达到了100%,真是学渣秒变学霸。要知道,在短短几个月前,人工智能解答类似的题,最高正确率不到10%。

那么,人工智能到底是怎么开挂的?

我们先来说说,为什么以前人工智能做不到?肯定不是因为算力不够,而是因为,解数学题不是直接算公式,而是需要你去理解文字,就像五庄观的人参果那道题一样。此外,有的题还需要联系上下文,并且包括了一些隐含条件。比如,一道概率论的题目,问:“在德州扑克游戏中,拿到两副对子的概率是多少?”这道题在人看来很清楚,但是对于计算机来说,其实是有很多隐含条件的。比如,一副扑克有52张牌、4种花色;德州扑克的一手牌有5张等等。人工智能不知道这些隐含条件,就没法算题。

而实现这个突破的核心,是一种新的翻译工具,名字叫做Codex。这是一个超大型的神经网络模型,经过了数以亿计的代码训练之后,就可以通过阅读人类的语言,理解语言想表达的意思,去掉与解题无关的多余信息,同时把语境背后的隐含条件补齐,最后用编程语言写出来。

比如刚才那道德州扑克的题,“拿到两副对子的概率是多少?”Codex翻译出来是这样的,你感受一下:“一副牌有5张,从13组牌、每组4张、共52张牌中,随机抽取。抽到两副对子,要求5张牌中一共有3种牌,每种数量最多两张。请问抽到两副对子的概率。”

你看,经过Codex的翻译之后,这道数学题就变成了一个很简单的编程问题,对人工智能来说是小菜一碟。

注意啊,Codex可不光是能让人工智能开挂,它也可能让我这样的普通人开挂。假设,世界上还没有发明俄罗斯方块这款游戏,是我先想出了这个游戏规则,但我不会写代码。怎么办呢?我只需要对Codex说一段话,比如:“我想要一个游戏,各种由四个方块任意组成的形状,从屏幕上方掉下来,按方向键就可以控制它们的左右移动和加速下落,屏幕里面的一行如果填满了就把这行消除……”那么,Codex就会按照你的表述,用计算机语言重新生成一段能够顺利运行的游戏程序,并且真的可以在电脑上运行来玩。

在2021年8月,Codex的发布会上,就演示了用大概几百个字的文字描述,自动生成了类似飞机大战、躲砖块这样的游戏。是不是听起来特别神奇?我一个不会写代码的人,也能成为游戏设计师。

最后,看完这篇研究我也有一个感受。看似简简单单的人类语言,我们理解起来毫不费劲,日用而不知,但是,强大的人工智能竟然需要经过数以亿计的代码训练,才能读懂语言背后的意思。我想起语言学家乔姆斯基的一句话:“研究人类的语言,就是探索人类的本质,也就是探索迄今所知人类独有的心智特性。”

来看今天的第二条。

最近,职场社交平台脉脉发布了《2021人才吸引力报告》,其中关于加班的部分引起了大家的关注。

你知道,互联网圈有种说法,2021年是“告别996元年”。从6月份起,字节跳动、美团、快手等多家互联网平台宣布取消“大小周”制度;8月份,人力资源社会保障部和最高人民法院联合发布超时加班典型案例,规定“996”工作制属于严重违法。

不过,根据脉脉发布的这份报告,在“告别996元年”,员工的加班压力并没有减轻。45%的职场人认为,相比年初,年末加班变得更多了;有27%的人认为加班频率保持不变;只有不到三成的人感到加班有所减少。看来,所谓“告别996元年”,目前还是雷声大雨点小。

另外,报告中有个调查结果很有意思,问“Z世代”,也就是“95后”“00后”人群,“什么是人生中最重要的事情”,你猜猜,排第一的是什么?是实现财务自由?还是获得更丰富的人生体验?都不是。排在第一名的是“身体与心理健康”,有超过七成的“Z世代”选择了这一项。你看,不得不说,一代有一代的主流观念,“Z世代”可能是最重视身心健康的一代职场人。

消息就是这样,我们来看看能学到点啥知识。

既要有出色的工作表现,又要保证身心健康,这就要求我们掌握一点科学休息的小窍门。或者,用万维钢老师的说法,叫“精确休息”。

高强度的脑力劳动者都知道,想要进入专注工作的心流状态,是不容易的。就像我,每天到了办公室,收拾收拾桌子,擦擦电脑屏幕,和同事聊聊闲篇,一看时间,半个小时过去了,还没写一个字。所以,很多人有一个误解,就是我好不容易进入了心流状态,当然是持续专注工作越长时间越好,等把重要工作全部弄完了再去休息。

其实这是不对的。这种方式,你也许的确可以持续专注工作三小时,但之后就会感觉非常疲惫、精力耗尽,不能够再次集中精力,导致这一天剩下的时间可能啥也干不了。如果你想在一天当中都保持精力充沛,要采用更科学的方式,给自己强制设定固定休息时间,比如每工作50分钟,就休息10分钟,起来走动走动,茶水间闲聊几句。这个方法,在很多提高工作表现的书里都有提到,比如万维钢老师解读过的《时机管理》《状态的科学》等等。

那么,这背后的原理是啥呢?我们大脑细胞工作的时候,会大量消耗能量,这时候就会产生一种细胞代谢的副产品,叫做“腺苷”。长时间高强度工作,导致腺苷大量堆积,人会觉得深度疲惫、情绪烦躁,不能再集中精神。而定时休息,等于是在腺苷浓度还不是很高的时候,就及时清理,让大脑始终保持一个清醒的状态。也就是说,最好的工作方式,不是“一次性冲锋”,而是“脉冲式攻击”“小步快跑、少量多次”。

总编室李倩老师是厨艺高手,她告诉我一个小秘诀:不要把菜全部做好了再收拾厨房,而是边做菜边洗碗,把厨房始终保持在一个干净整洁的状态。这样,你做每一道菜的心情都会很好。你看,这是不是跟定时休息的道理有点像?

顺便说说咖啡因提神的原理,它不是降低腺苷浓度,而是阻止身体感受到腺苷,等于是骗过了大脑,让它接收不到腺苷的信号,觉得好像不困。但其实,这时候腺苷仍然在身体里堆积,等咖啡因的效力一过,人往往会感觉更困。

好,这个道理我们懂了,接下来还有一个问题,就是定时休息,停在哪儿比较合适?比如写稿子,我之前的做法是,写在一个地方,正好卡壳了,没有思路,正好停下来歇会儿。但是我发现这样有一个问题,就是当休息10分钟回来,再次开写的时候,特别困难,迟迟进不了状态。因为本来就是卡在这儿了,休息回来,一时间更没有思路。

后来贾行家老师教了我一个办法。他说,你不要在卡壳的地方停下来,而要在你有把握的地方停下来。比如这一段,你已经想清楚要写啥了,只差落笔,这时候就果断停下,去休息。等10分钟回来,接着你有把握的地方写,就可以毫无压力地冷启动。等这一段写完,你也就进入了专注状态,可以接着构思下一段内容了。“在你有把握的地方停下”,这个方法你可以用起来。

最后分享一句金句:掌握科学的休息方法,可以“让你的状态对得起你的付出,让你的表现不辜负你的努力。”(《自控力》作者凯利•麦格尼格尔)

来说说咱们得到的事儿。

今年跨年演讲首发了一本新书,著名经济学家何帆的《变量4:大国的腾挪》。何帆老师发愿,要用30年时间,每年写一本书,记录中国历史上至关重要的30年,这件事他已经做了四年。我自己是以“追剧”的执著,来追这套书。我给你说说我的理由。

第一,借助经济学家的眼睛,看中国大地上发生的变化。在过去的四年里,何帆老师每年都会花10个月以上的时间,在全国各地调研和采访,这是你在“朋友圈”看不到的新鲜中国。同时,作为经济学家,何帆老师关注中国最重要的四个慢变量:工业化、城市化、技术创新和人口变化,以及不断涌现的小趋势。这些,是我们每个人都有可能去抓住的时代机遇。

第二,也是更重要的,这套书可以唤醒我们身上的历史感。作为普通人,我们往往容易低估自己,感觉自己干的事情,跟这个大时代好像没有多大关系。“变量”书系,让我们意识到,自己的命运和他人的命运息息相关,也和历史的进程息息相关。

现在,何帆老师的《变量4:大国的腾挪》已经全面上市,在当当网、京东、天猫,以及在得到App商城都能买到。

今天就聊到这儿,《得到头条》,下周见。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top