你好,这里是《邵恒头条》,我是邵恒。今天我想跟你分享的材料是9月份的《硬科技报告》。
在这期报告中,彭天放老师跟我们分享了两项跟“效率”有关的最新科技进展:一是全球最大的芯片问世,这可能会让超级计算机或者云计算中心的计算效率再上一个台阶;另一项进展是科学家发现,用电流刺激一个人的迷走神经,可能会让人学外语学得更快。
接下来我们就一起来听听,彭天放老师的解读。
你好,我是彭天放,欢迎来到9月份的《硬科技报告》。
在过去的一个月里,我为你梳理出两项值得关注的硬科技进展:
1. 初创企业Cerebras System推出世界上最大的计算芯片
第一项进展,来自我们最近都很关注的芯片领域。
在我们传统的印象里,芯片的大小通常跟我们的手指甲盖差不多。但不知道你有没有好奇过,世界上最大的芯片到底可以有多大呢?
8月19号,著名的科技媒体Venture Beat就报道了一项来自硅谷的初创公司Cerebras的最新成果。这家成立仅仅4年的公司,最近制造出了一款被叫做“晶圆级发动机”的,迄今为止全世界最大的计算芯片。
这款芯片有多大呢?它是一个边长22厘米,面积达到46000平方毫米的正方形硅片,足足跟一本16开的书差不多大。相比之下今年5月,英伟达发布的全世界最大的GPU芯片A100——它的面积只有826平方毫米,还不到这款芯片的五十分之一。
我在文稿区放了一张这家公司发布的芯片示意图,你有兴趣的话,可以感受一下这块芯片到底有多大。
而且,这款芯片不仅仅是个头大,在很多性能参数上也是强得惊人。比如,在计算内核的数量上,今天一块芯片上一般最多也就是几千个计算内核,而这款芯片拥有40万个计算内核。再比如晶体管的数量,这款芯片也达到了惊人的1.2万亿个,是现在常见计算芯片的100多倍。
可以说,这块芯片都属于芯片家族里的“巨无霸”选手。
听到这里你可能会好奇了:这种跟人脸差不多大的“巨无霸”级芯片,肯定是不能用在手机和笔记本电脑上了,那它有什么应用场景么?
Cerebras这家公司表示,它未来瞄准的应用场景,主要是超级计算机和大型云计算中心。目前,这家公司已经和美国著名的劳伦斯利弗莫尔国家实验室展开合作。这块儿“巨无霸”芯片,将首先被集成到位于这所实验室里,目前全世界性能排名第14的超级计算机“拉森”上。
听到这里不知道你会不会有一个问题,那就是:单纯做个超大号的芯片,这个思路也太简单粗暴了,感觉不符合芯片技术平常给我们的那种高精尖的印象啊。而且要知道,超级计算机以前不都是把上万块传统芯片并联起来用嘛,效果好像也不错啊,为什么还要开发这种“巨无霸”芯片呢?
其实,事情的关键就在芯片之间相互通信的速度上,听我来慢慢给你解释:
首先我们要知道,今天不论是超级计算机还是云计算中心,都是由几十万,甚至上百万颗芯片所组成的复杂系统。系统整体的运算性能,早都已经不仅仅取决于单颗芯片本身的性能了。另外一项非常重要的因素,这些年正在越来越受到重视,那就是芯片之间相互通信的速度。这就像是一家公司的运行效率,不仅取决于每个员工的个人能力,也取决于员工之间回复消息的速度一样。
为什么芯片间的通信速度越来越重要呢?这是因为,今天我们所面临的很多真实的应用场景,比如训练人工智能算法、科研工作中的物理仿真、汽车的自动驾驶,背后所需的计算量都在变得越来越大,都需要依靠越来越多的芯片一起合作完成。比如,2019年全球性能排名第一的超级计算机“顶点(Summit)”就包含了240万颗IBM提供的计算芯片。
如此大量的芯片,在合作执行计算任务的过程中,相互之间就需要传输大量的数据。所以,提高芯片之间的通信速度,能够非常明显地提升超级计算机的整体性能。这就如同,如果公司所有的同事之间都能做到秒回微信,公司整体的运转效率会提升一样。
那如何提高芯片之间的通信速度呢?
传统的思路,是优化芯片之间的通信接口。比如谷歌云服务中使用的AI芯片TPU,就专门在每块芯片上都专门设计了4个用来做芯片之间通信的接口。但是这种思路有一个天花板,那就是以如今的接口技术,芯片之间的通信速度达到每秒钟几百甚至上千GB就已经接近极限了,再要提升,技术上可能会非常困难。
这里要额外提一句,每秒钟几百GB的速度,听起来还是挺快的,但是对于云计算中心而言,依然会成为制约整个系统运算性能的关键因素。那还有什么别的办法继续提高数据传输速度么?诶,这就要说到Cerebras这家公司的“巨无霸”芯片了。
它的思路是,干脆把以前很多块小芯片合在一起,做成一块儿大芯片。这样原来很多需要芯片之间相互通信的任务,就可以在芯片内部进行数据传输了。而要知道,芯片在自己内部传输数据的速度,是远远高于芯片之间通信的速度的。这就如同,我们左脑跟右脑相互沟通的速度,肯定比我们跟别人说话沟通的速度要快。
事实上,按照这家公司披露的数据,这块芯片内部通信网络的整体速度可以达到100PB每秒,是目前最快的芯片之间的通信接口速度的10万倍。如果未来超级计算机都使用这种“巨无霸”芯片,那就能够很好地解决芯片间通信速度——这个制约运算速度的瓶颈对整体性能的制约影响。
那既然把计算芯片做大的好处这么多,为什么以前没有人做呢?——其实,还真不是以前没人做,而是这件事儿太难了,以前还没有人能做到。为什么这么说呢?问题的关键就在“可靠性”三个字上。
你可能也知道,所有的芯片都是在一块圆形的硅片上,经过非常精细的半导体工艺加工而成的。在加工的过程中,难免会有一些加工缺陷和误差,导致硅片上某些局部是失效的。
在过去,一块硅片上通常会切割出几百块小芯片,刚刚的这些局部工艺误差,顶多也就影响其中一部分芯片。我们只需要把剩下一部分完好无损的芯片挑出来,就可以到市场上销售了。
听到这里你可能已经明白了,既然加工过程中难免出现一些工艺缺陷,那一块芯片的面积越大,上面出现缺陷的概率也就越大,所以想要成功把它制造出来的难度也就越高。像这次发布的“巨无霸”芯片,面积是过去芯片的50多倍,对于工艺可靠性的要求,理论上就提高了50多个量级。
这么高的可靠性要求,在过去是很难做到的。这也就是在过去很少有这种超大型芯片的原因。那这家仅仅创业4年的公司是怎么做到的呢?答案就是,它对芯片的结构进行了可靠性优化设计。比如,在芯片内部设计一些冗余和备份的结构,让硅片上即便出现一些加工缺陷,也不会影响芯片整体的正常使用。事实上,这种对芯片进行可靠性优化设计的技术,恰恰就是这家初创公司最核心的技术创新。
听到这里有的同学可能还会想,既然可以通过可靠性设计把芯片变大,未来我们能不能做个更大号的芯片呢?——很可惜,答案是不能,或者说至少短时间内不能。
因为芯片加工的原材料硅晶圆,是有固定尺寸规格的。目前工业界最大号的硅晶圆的直径是12英寸。你有兴趣的话可以自己算一下,在一个直径12英寸的圆形里面,划出一块最大的正方型,面积可以有多大?——你会发现,答案恰好就是大概46000平方毫米,也就是这块儿“巨无霸”芯片的面积。
换句话说,这块芯片已经几乎是当前半导体工艺能够加工出来最大的芯片了。我们未来如果想提高这种巨型芯片的性能,主要的方向还是继续优化工艺和可靠性设计方法。事实上,这也是Cerebras目前披露的第二代“晶圆级发动机”的主要思路。
通过这项硬科技进展,我们可以看出来,芯片迄今为止依然是一个非常活跃的领域。在芯片的设计上,还有很多类似“巨型芯片”这样脑洞大开的思路可以尝试。这同时,也意味着我们国家的芯片产业,除了加速追赶世界第一梯队之外,也依然存在着很多换道超车的可能性。
我会为你持续关注这方面的新进展。
2. 匹茨堡大学研发出提升成年人语言学习能力的“耳机”
我为你推荐的第二项硬科技进展,可能会让一些学外语比较吃力的同学感到一丝兴奋。
8月6号,来自匹茨堡大学的科研团队在学术期刊《学习科学》上发表了一项有可能在未来提高成年人的语言学习能力的研究。在这项研究里,科研人员用一种类似耳机的设备,给几十位正在学习汉语声调的国外志愿者,施加了一种非常微弱的电流刺激。通过这种方法,让这些测试对象识别汉语语调的准确率平均提高了13%,学习的速度提高了将近一倍!
我在文稿区放了一张实验中的志愿者佩戴这款设备的照片,可以看得出,佩戴的效果非常像我们平时戴耳机的样子。如果未来某一天,我们真的仅仅通过戴上这样一款“耳机”,就可以缩短学习外语的时间,确实很令人期待。
说到这里你可能会好奇了,为什么通过耳朵施加微弱的电流刺激,能够影响人的语言学习能力呢?这两个看起来八竿子打不着的事情,研究人员究竟是怎么想到的?
其实,这种给人的外耳施加电刺激的方法,可不是研究人员拍脑袋想的,而是一项已经研究了很多年,被叫做“迷走神经刺激(VNS)”的技术。也就是通过给人体的迷走神经施加微弱的电信号刺激,来改善神经系统功能的技术。关于这项技术的研究,过去主要还是集中在医疗领域,用来治疗癫痫这样的神经系统疾病。
但是近些年来人们发现,这种迷走神经刺激技术,在医疗范畴之外,还有很多其他有意思的效果。比如就有好几项研究都发现,在刺激迷走神经的同时播放音频信号,可以在某种程度上提升动物,甚至是人对于听觉信息的专注度和记忆力。
科学家们于是就大胆地设想,既然迷走神经刺激技术能够影响听觉,那能不能再进一步,尝试用这种技术直接对人的学习语言过程产生影响,甚至是提升呢?——这也就是匹茨堡大学的研究人员开展这项研究的原始思路。
不过,做科学研究只有原始思路是不够的。为了让研究成果安全、可靠地呈现在公众面前,还需要解决很多执行层面的问题。比如改进迷走神经刺激设备就是一个很现实的挑战。过去的迷走神经刺激设备,很多都是所谓“侵入式”的,也就是需要通过一个小的外科手术,把电极植入迷走神经附近。
如果使用这种侵入式设备来做研究,不仅很难招募大量的志愿者,采集不到足够多可信的数据;而且也会给读者一种小题大做的感觉。毕竟,很少有人会为了提升外语学习的效果,去做一台外科手术。
正因为如此,匹茨堡大学的研究人员在这篇论文中一个重要的创新,就是使用了一种非侵入式的迷走神经刺激设备,也就是一开始我们提到的类似耳机的设备。
具体的研究过程大致是这样的:
科研人员组织了36名以英语作为母语的志愿者,分成三组来学习识别汉语普通话的声调。其中的两组是实验组,在接受迷走神经刺激的同时,分别学习区分汉语中的一声三声,以及二声和四声。这里特别有意思的是,在研究人员看来,区分汉语中的二声和四声是比较困难的。于是这两个实验组,相当于完成了两个难度不同的语言学习任务。而第三组志愿者作为对照组,没有接受迷走神经刺激。这个组用来检验其他两个实验组在迷走神经刺激之下的学习成果。
研究人员发现,完成简单语言学习任务的这一组志愿者(也就是学习区分一声和三声的这一组),随着学习时间的增加,判断的准确度显著地高于对照组,准确率平均高出13%。这足够说明,这种非侵入式的迷走神经刺激设备,确实能够对人的语言学习过程,产生一定程度的正向促进作用。
但是与此同时,完成比较困难学习任务的这一组志愿者(也就是学习区分二声和四声的这一组),在学习效果上比对照组并没有明显提升。研究人员推测,这有可能是由于刺激的位置,或者电信号本身的特点,导致这一组的实验效果并不显著。
这样的研究结果,可以说一方面让后续致力于增强人类语言学习能力研究看到了成功的希望。但另一方面,其实也暴露了这类研究的一个通病——那就是,由于我们对人脑学习过程的底层原理仍然不清楚,很多研究往往只能是从一个现象到另外一个现象,还很难给出底层原理的解释。
比如在这项研究中,研究人员从迷走神经刺激可以提高人脑听觉区域的活跃程度等等现象出发,推测语言的学习过程也很可能被微弱的电流刺激所影响,于是设计实验进行研究——结果果然发现了新的现象。但是,如果你要问为什么一声和三声的学习效果就明显好于二声和四声的学习效果,科学家们也只能尽力给出合理的猜测。
事实上,不要说这么复杂的问题,就连为什么电刺激能够显著提高第一个实验组的学习效果,研究人员也不知道,而只是给出了自己的推测。——他们认为,很可能是电信号的刺激,增强了神经元之间化学成分的活跃程度,从而一定程度上增强了大脑的可塑性,从而提高了学习效率。
可以看得出,关于人脑的学习原理,未来还有很多的研究工作需要开展。脑科学也不愧被称为“人类科学最后的前沿”。
不过尽管这样的研究结果并不完美,但它依然打开了我们看待学习语言的一个新思路,那就是:未来人们确实有可能通过外部设备的帮助,提高人类的认知和学习效果。
匹茨堡大学的研究人员也乐观地表示,希望在未来2到5年内做出具有真正实用意义的研究成果。我也会为你继续关注这个领域的进展。
本月的《硬科技报告》就到这里,我们下一期再见!
好了,《硬科技报告》听完了,我是邵恒。
这期报告让我想到前一段时间,我在得到上的《芯片技术》课程里看到的一个判断。其实人类现在已经进入了一种新的生存状态:我们是一半的生物人,一半的数字人。我们的物质世界和数字世界前所未有地融合在了一起。在未来,可能有越来越多的生物功能,都有希望借助数字世界的力量进行优化、迭代。那么,在未来某一天,人的进化会不会也开始遵循一个类似于“摩尔定律”的规律呢?我在这里开个脑洞,欢迎你在留言区分享自己的看法。
好了,这就是今天的《邵恒头条》,我是邵恒,我们明天见。