150|大模型下半场:不比写诗,只比做事

精挑细淘,得到头条。我是李南南。

今天,我将从两个话题出发,为你提供知识服务。第一个是,升级版华为盘古大模型,登上《自然》杂志。第二个是,迪士尼100周年,推出反派纪念套装。

先来看今天的第一条。我们说一个挺争气的事。就在7月9日,也就是上周,《自然》杂志上发表了一篇文章,主要内容是介绍华为的盘古气象大模型,这是一种用于气象预测的大模型。为什么说争气?因为这是目前第一篇,中国科技公司作为唯一署名单位,发表在《自然》正刊上的论文。

我们先说论文的主要内容。核心可以用一句话概括,叫,AI天气预报,终于超过了数值天气预报。

什么意思?在目前的天气预报领域,最主流的预测方式,叫数值预测。你可以把它理解成,用解方程的方式,来预测天气。

这就好比,你要判断老王今天几点吃饭,你就要搜集很多信息。比如,老王早上是几点吃饭的?吃了多少?再比如,老王今天中午有没有应酬?有没有人约他吃饭?等等。这些信息,就叫数值。同时,有一个非常懂老王的人,设计了一个方程式。只要你把这些数值代入方程,就能算出老王几点吃饭。

数值天气预报的原理,就跟这个过程有点像。你搜集了很多关于天气的数值,代入方程,再求解,算出天气。换句话说,你看到的绝大多数天气预报,其实是用方程式算出来的,并不是来自,西边来了一片云,因此今天要下雨,这种直接的观测。

当然,你可能也发现了,数值预报,经常不准。怎么办?有人就想,全程用AI来做预报,具体的技术细节就不展开了。但问题是,AI预报的,更不准,而且慢。而这回,盘古气象大模型之所以能登上《自然》杂志,就是因为,作为AI预报,它第一次在精度和速度上,都超过了传统的数值预报。而且速度比数值预报,提升了大概10000倍。在一张V100专业显卡的支持下,大概只需要1.4秒,就能预测出全球24小时的天气。

听到这,你可能会说,这顶多算是气象领域的进展,跟我有什么关系吗?别着急,咱们要说的重点,并不是气象AI,而是它背后的华为盘古大模型。

就在上周末,华为刚刚举办了2023年开发者大会。假如把不同行业比作武林里的不同门派,那么开发者大会,就像一场针对武林人士的兵器展。给你看看今年出了哪些称手的新工具。而今年华为开发者大会最重要的事,就是发布升级版的盘古大模型。盘古大模型在2020年就已经开始研究,比GPT-3还要早一点。这回公布的,是最新的升级版。

当然,估计今天提起大模型,很多人都有点麻木了。毕竟,今年关于大模型的新闻太多了。但是,这回的盘古大模型,还真不太一样。借用华为自己的话说,这回的盘古大模型,是一个产业大模型,它不会写诗,只会做事。

要想弄清盘古大模型背后蕴藏的新机会,我们需要搞懂这么三件事。

第一,大模型的下半场,拼的是什么能力?你可以这么理解,大模型的能力,正在从解决困难型问题,转变成解决复杂型问题。

注意,难和复杂,这是两个不同的概念。

难,指的是这个问题在知识层面上要求很高。比如,写一首诗、画一幅画、做一道数学题。这个过程就像跳高,目标虽然高,但落实到动作上,无非就一个字,跳。现在的很多大模型,核心能力都在于解决这类困难型问题。这类问题的特点就是,回答起来有难度,但问题的链条很短,一问一答,就结束了。

但是,你肯定也发现了,在现实世界中,大多数真实挑战,它的链条都很长。我解决第一个问题,又会衍生出第二个问题。解决第二个,后面还有第三、第四个。现实世界的挑战,往往是一组问题的集合。就好比教小孩子写字,看起来简单,但是,你不可能一开始就设计好所有的方案。你得先教完一部分,看看小孩子写得怎么样,再根据他的表现调整后面的方案。说白了,就是得走一步看一步,根据实际情况随时调整。

这类环环相扣的问题集,就叫复杂。解决它需要的不仅是抽象的知识,更是来自前线的一手经验。

说白了,你能执行一个具体任务,能干成一件具体的事,这个应对复杂问题的能力,也许是很多行业更需要的。

而这回的盘古大模型,核心就在于这个解决具体问题的能力。盘古大模型,是一组预训练大模型和工程应用平台的统称。所谓预训练,指的是它已经预判到了将来可能遇到的问题,并且储备了相应的解决问题的能力。

具体看,盘古大模型,内部包括三个能力段位,分别是,L0、L1、L2。

L0能力段位,指的是大模型的通用能力。就好比,这人天生是个练武奇才,骨骼清奇,天赋极高,而且已经打通任督二脉,练什么功夫都快。你想让它练什么,比如,学怎么做天气预报,怎么做药物研发,好,你可以稍微教教它,一学就会。

L1能力段位,指的是更针对具体行业、具体企业的大模型。就好比练武,这个大模型已经精通独孤九剑、降龙十八掌,具体的功夫已经练好了。

L2能力段位,就更具体了,它针对的是具体的业务场景,比如,让一个懂降龙十八掌的人,去做保镖,护送一个人从上海到北京。你看,这就是非常具体的任务。L2级别的大模型,具备的就是这类解决具体任务的能力。

简单说,假如L0是个通才,L1是个专才,那么,L2就是精通某件事的老师傅。企业需要哪个,就可以调用哪个。借用华为自己的话说,通用大模型是人类的大脑,而工业领域大模型,就是手和脚。它的核心能力,在于做成具体的事。

这是盘古大模型背后的第一个重点。我们能从中看到,大模型的未来方向,正在从解决困难问题,转向解决复杂问题,执行具体任务。

第二个重点是,这回的盘古大模型,实现了算力的国产化。说白了,这回盘古大模型用的芯片,是咱们自己的。我们都知道,AI的训练有三个关键要素,算力、语料、训练方法。而且其中最底层的能力基座,就是算力。这也是为什么在这一轮AI热中,英伟达成了最大赢家。而这回,华为训练盘古大模型用的,包含GPU在内的芯片,全部是华为自研的昇腾芯片。

说到训练,在这还得特别强调一句。按照华为开发者大会上的说法,未来的大模型训练,将出现一个新趋势,端云协同。也就是,有分布在各处终端的无数双手,同时执行各种各样的任务,积累各式各样的经验。而这些经验,最终将沉淀到同一个云端的大脑。

比如,某一条工业流水线上的质检,这个场景看起来非常小,很难积累出大规模的经验。但事实上,它并不是小,只是分散。假如能把每一个企业,每条流水线上的质检经验加在一起,就能形成一套稳定的解决方案。从这个角度看,大模型的应用部署,更像是一场新训练的开始。

第三个重点是,大模型未来的研究趋势。按照这回开发者大会上的说法,未来在行业应用方向,大模型的发展重点主要有这么几个。

首先,是垂域数据标注与模型微调将成为重点。也就是,大公司提供基础大模型,而细分行业里的公司,为大模型提供垂直细分领域里的数据,通过微调,让它们在细分任务上有更好的表现。

其次,是大小模型协同。也就是,在遇到复杂任务时,需要通用型的大模型,与专家型的小模型配合解决。这个解决方案可能不是一步到位,可能每个环节,需要调用不同的模型。

其实,这些重点,可以概括成一句话。过去说起大模型,它的优点是,够聪明。但是未来说起大模型,它需要的是,有本领。够聪明,指的是你针对一个问题,有足够的知识存量。而有本领,指的是你能面对挑战,把事办成。

再来看今天的第二条。今年,是迪士尼成立100周年。这么大的事,迪士尼肯定要推特别产品。而就在6月初,迪士尼联名乐高,推出了一个很特别的100周年纪念套装。特别在哪?它的主角不是白雪公主、小美人鱼、米老鼠这些主角,而是,全都换成了反派。比如《白雪公主》里的皇后。当然,尽管是反派,但销量都还不错。

其实,这件事仔细想想挺奇怪的。你看,我们明明知道,电影里的反派不是好人,但是,有时候,你就是忍不住喜欢他。比如,《蝙蝠侠》里的小丑,就在2009年获得了奥斯卡男配角奖,后来还出了单人电影,又获了大奖。再比如,年初大热的电视剧《狂飙》,大家最津津乐道的角色,也是反派人物高启强。

那么,反派为什么这么迷人呢?今天,我们就来回答这个问题。

今年5月,《自然》杂志上刊登了一篇研究,来自美国几所大学的心理学家和神经科学学家。文章的标题,叫做《人们对不道德和道德模糊的人感到好奇》。主要内容就是,大家为什么喜欢反派?

这个研究,分成三个阶段。

第一个阶段,是验证阶段。也就是要证明,是不是大多数人都喜欢反派?还是只是偶然现象?研究人员做了一个统计,找出奈飞上面最受欢迎的电视剧。先让志愿者给主角的道德水平打分,然后把主角们分成两类,好人和坏人。结果发现,这些最热门的电视剧里,有59%,也就是接近六成,主角都属于低道德水平,也就是所谓的坏人。

接着,研究人员统计了针对不同剧集的观看时长,结果发现,主角的道德品质,和观众的观看时长之间存在着一种显著的负相关关系。一句话总结,主角越坏,观众观看的时间就越长。这说明,观众确实会被反派吸引。

第二个阶段,是量化阶段。也就是,一个反派,坏到什么程度最迷人?

研究人员这回把人物角色,按照道德水平从高到低,分了四类。第一类,道德水平高,通常是英雄或者大好人;第二类,道德水平一般,也就是普通人;第三类,道德水平模棱两可,也就是亦正亦邪的角色;最后一类,道德水平低下,也就是大坏蛋、大反派。

结果发现,观众对道德表现极端的角色最感兴趣,也就是那些特别好的角色和特别坏的角色,比如大英雄和大反派。观众对亦正亦邪的角色也很感兴趣,并且觉得他们的神秘性是最强的。而观众最不感兴趣的,是道德水平平均的普通人。

实验的第三阶段,研究的是观众为什么对反派感兴趣?

研究过程很复杂,咱们直接上结论。因为反派,往往能激发观众寻求解释的好奇心。也就是,他到底为什么这么做?图个什么?观众会特别热衷于探索他们的动机。而对于正派,大家关注的重点不是动机,而是行为。换句话说,对于超人,大家不关心动机,大家只想看他拯救世界的行为,用了哪些超能力?救了多少人?而对于邪恶博士,大家就关心,他为什么这么坏?到底是什么把他变成了这样?

研究人员认为,这体现出的,其实是一种学习倾向。越是跟我们不同的人,我们越想了解他们的内心世界,他们的行为越偏离我们的想法,我们越想知道他们为什么要这么做。当你不知不觉被反派吸引,其实是对跟自己完全不同的人产生了兴趣。换句话说,反派之所以吸引人,是因为它在一定程度上,激发了人的探索本能。

最后,总结一下。今天说了两个话题,大模型发展的新趋势,以及反派受欢迎的原因。假如你的身边有人对这两个话题感兴趣,推荐你把今天的节目分享给他。

好,以上就是今天的内容。《得到头条》,明天见。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top