伙伴们,快刀广播站又开始广播了。
这两天在AI技术圈发生了一件事情,马斯克把自己旗下AI公司的大模型Grok项目完全开源,上周他就在自己的社交媒体上宣布了这个消息,不过因为他要管特斯拉、SpaceX,还有以前的推特(现在改名为X的媒体平台),另外还有脑机接口公司,所以最初大家都以为只是随便说说,顺便让OpenAI不痛快一点儿。
Grok这个名字,是非正式语境下“理解”的意思,被认为是按照著名科幻小说《银河系漫游指南》里人工智能的模样来设计的,它的核心特征是会用幽默、智慧的方式来回答问题,比较有人味儿,但是不会过多的涉及政治敏感问题。
消息发出不到一周,Grok-1版本就正式在Github平台上开源了,并且开源得非常彻底,这个开放版本包括了3140亿参数的基础模型。这个数字意味着什么呢?目前排名第二的开源模型参数是650亿,Grok是它的4倍多。
开源文档中,特意标明这个版本在预训练阶段花了4-5个月的时间,是由大量基础数据训练出来的,并未针对任何一种特定场景进行微调。微调指的是对聊天、写作、计算等方面进行针对性的强化,没有微调就意味着对所有开发者或者机构来说,普适性更好,相当于给了你一张质量很好的白纸。
另外,这次Grok的开源是比较彻底的,可以商业使用、修改和分发,但是不提供与社交媒体X中实时数据的连接,不允许自己去注册商标,使用者也不会受到任何保证。如果要说限制条件的话,就是必须复制原始的许可证和版权声明,并且要声明他们所做的任何更改。简单一点儿说,就是你想用随便用,有本事卖钱也可以,但是自己调试过程中出现问题,别想着去找人家开源团队的麻烦,也不要直接套个壳自己去申请专利。
如果你不是一名技术人士,可以简单地把开源理解为,一个技术团队把自己最核心的能力向全世界和盘托出,极大地提升其他团队的能力,启发并且促进某一个技术领域的发展。我有个朋友,在一个大厂里管理一个小型的研究团队,在一个课题项目上研究了一年半,就在他们快要出成果前的一个月,另一个硅谷大厂开源了项目,同样的课题处理的方式更强大、更有前瞻性,我那个朋友的课题组一下子就被解散了。后来我问他对这个让他丢掉工作的开源项目有什么感受,他说的是:“真是又爱又恨,爱的是他们的实现方式太厉害了,让我开了眼界,恨的是他们要是早一年做出来多好,我就不用浪费那么多时间了。”也正是因为有这些开源的项目,才能推动很多技术向前发展。
我知道有很多人不喜欢马斯克,毕竟他太有个性了,但是如果我们不谈性格,单单从做事的维度上来说,他有很多值得我们学习的地方,我跟大家说几个让我记忆特别深刻的事情。
第一个是不申请专利。马斯克旗下的几个业务,从电动车特斯拉,到发射火箭的SpaceX,再到现在开源的Grok,都开放所有专利,旗下公司不搞垄断。例如,特斯拉会把自己的充电器和充电桩技术开源出来。马斯克在接受采访时,原话是:“我旗下所有公司都不做抑制竞争的事情。”要知道,他所在的地方是硅谷,有大量的公司是靠专利的授权费持续几十年挣钱的。
不过特别魔幻的是,当年马斯克开源特斯拉充电技术时,居然有汽车从业者在朋友圈里骂,说他为什么不开源另外的A技术和B技术,那才是特斯拉最值钱的,所以现在的开源是沽名钓誉,是市场公关行为。当时看得我瞠目结舌,这相当于什么?相当于别人家做了特别好的蛋糕,放在家门口给邻居们免费分享,这时你冲上去指着别人鼻子骂:“你们家明明做的水煮鱼更好吃,为啥不把水煮鱼放门口,你们这就是沽名钓誉想当业主代表吧?”
对于马斯克来说,这些噪声根本不重要,他也表达过专利是过去的荣誉,当一个团队过去的荣誉太多了,就很容易忘记创新,从而变成腐朽的样子。
第二个是回归问题本质。当然,更流行一点的说法是回归第一性原理。有航空爱好的朋友去看过SpaceX的发射,我问他最大的感受是啥,震撼不震撼。他说很震撼,但绝对不是火箭发射带来的,而是整个去看发射过程的体验。之前航空航天在他心目中特别神圣,一切都是高精尖的。但是对于SpaceX来说,不发射的时候,发射场想进随便进,道路也不好,连地面的基本卫生都不怎么样,所有跟火箭发射不相关的地方,一律不花钱。
其实最让我佩服的是马斯克解决问题的思路,非常简单直接,绝不考虑其他人怎么干的问题。例如把航天材料中的铝合金换成了不锈钢,从成本上节约了很大一块。例如最开始所有人都觉得他要回收火箭的想法,像天方夜谭一样,但是现在已经非常稳定、精准地实现了回收再利用。例如要加大重型火箭的推力,他就把几十台猛禽发动机绑在一起启动,这样的话,哪怕有时有几台不工作,也不太影响大局。更主要的是我看过一个纪录片,马斯克带着采访组进组装车间,发现放着一排排的猛禽发动机,他说这样搭积木的方式,有个好处就是不怕炸,随时放一批制造好的发动机,哪怕今天上天炸了,明天又可能再绑几十台做测试。这种感觉就是他是在搭乐高,只不过毁一次就要赔很多钱。
例如这次星舰的发射,我在看前期资料的时候,还有几个让我瞠目结舌的做法。在发射架上有两个抓取机械臂,负责干什么呢?这俩机械臂叫“筷子”,非常形象,主要为了夹住返回的“星舰”飞船。因为工程团队当时为飞船着陆时的着陆腿发愁,担心无法承载飞船回来时,落到地面时的巨大冲击力。马斯克就问工程负责人:“为什么我们不抓住它们呢?这样就不用落在地上了。”最开始团队都以为他是在开玩笑,后来才意识到老板真的这么想。现在这个功能已经做出来了。
第三个是活得简单。他刚接手推特的时候,有一个特别有意思的细节,就是他希望把主要的机房搬到另外一个州,叫来运维的负责人,负责人说因为涉及很多线上服务的迁移,毕竟是一个全球使用的软件,所以需要八个月的迁移时间。没过几天,马斯克和自己弟弟在飞机上聊起这件事情,说为啥要这么久,咱们自己去搬怎么样。他当即就让私人飞机返航,开着皮卡去了机房,先自己试了一下如何钻到服务器下面,撬开电箱,拔掉服务器,发现并没有什么事情发生。第二天,还是圣诞前夜,他召集了好几个动手能力极强的朋友,花2000美金去苹果店买下了所有的AirTags,就是我们绑在包上防止丢失的小东西,绑在了服务器上,然后去超市买了搬家的各种螺丝刀之类的工具,找搬家公司搞个半挂车,就把几台主机搬到了卡车上。从这件事情上就可以看出,马斯克对自己认准的事情,真是生死看淡,不服就干。
当然,最后要说一下,Grok的开源运行效果不一定会特别好,因为这更多的是面向技术从业者或者研究机构,他们的是基础模型,并没有OpenAI那样海量的用户在上面使用。我们只要知道这件事情就可以了,家里没矿的,就不要想着下载这个模型去尝试一下了,因为哪怕运行跑一下测试,都需要足够的显卡内存。哪怕家里有矿,或者是企业研究团队,也可以稍微等等,看看开源后一两周的评测结果再考虑要不要上马。
好,今天的快刀广播站就到这里了。如果你觉得今天的内容对你有帮助,欢迎分享到朋友圈或者转发给你的朋友们。明天咱们接着聊AI。