伙伴们,快刀广播站又开始广播了。
最近AI领域一个比较大的瓜,是一个由三个斯坦福学生组成的AI团队,发布了一个开源模型,叫做Llama3-V。一发布就受到了非常大的关注,毕竟顶着斯坦福AI团队的头衔,发布的又是一个多模态的开源模型,所以就成为了风云人物。
但是,发出来之后就特别好玩了,先是被网友扒出来里面的很多具体实现方式,与中国大模型公司面壁智能的MiniCPM-V系列开源模型非常相似。随着找到的证据越来越多,这三个人直接就把模型删库跑路了。
随后,面壁智能的首席科学家、清华大学的刘知远教授经过调查,拿出了一个重量级的证据,就是这个模型对清华简的识别能力。什么是清华简呢?这指的是清华大学收藏的一批战国时期的竹简,这些竹简是在2008年由清华大学校友捐赠给学校的,因此被称为清华简。里面内容非常丰富,包括了古代的历史文献、辞赋等等。要知道,这批竹简的识别能力,是面壁智能做的一个彩蛋功能,因为这是用他们逐字扫描清华简后,人工标注的数据集训练的,从来没有对外面公开过。而这个斯坦福团队的开源模型,识别这批清华简,做对的题和做错的题,都跟面壁智能的模型一模一样。这就好比考试时,连同桌的名字都抄上了。
这件事情让我想起了早年输入法大战时,搜狗输入法把一个对手告上了法庭,理由就是抄袭。当时,搜狗输入法有个小众词库,是把搜狐全体员工的名字加到了系统词库里。举个例子,今年刚拍了《年会不能停》的大鹏,本名叫董成鹏,当时还是搜狐娱乐的一个编辑。那么除了搜狗输入法,其他输入法都不应该在打完这三个字的拼音后,直接出现“董成鹏”三个字。这就在当时被拿出来当作了证据。是不是和今天这个事件,有异曲同工之妙。
我们回到这次大模型的抄袭事件,被人实锤之后,这个团队的三个人马上就各自飞了。其中两名斯坦福的本科生悉达多和阿克什发了致歉推文,核心意思是我们三个看起来是一个团队,其实我俩只负责在网上推广这个模型,是另外一个人穆斯塔法写了所有的代码,但现在我们已经联系不到他了。
穆斯塔法在推特上开启了保护锁定,其他人都不能关注他或看到他的内容。连斯坦福人工智能实验室的主任都看不下去了,发文说这个团队居然还不承认自己的抄袭,还在找借口甩锅。
这件事情到这里基本告一段落,不过它也引发了不少技术社区的讨论。讨论的焦点不在抄袭本身,而在于是否忽视了中国AI领域的发展。要知道,面壁智能被抄袭的模型,是通过这种方式才被很多业内人士关注到的。核心还是因为那个抄袭的团队,顶着斯坦福AI团队的帽子,就让人先入为主地认为他们一定很厉害。
大家如果关注媒体报道,就会发现去年五六月份,采访大佬们时最常问的问题是“我们离GPT-4的水平还差几年?”但是今年已经很少有记者这么问了。作为一个AI学习者,我今年的感受也跟去年完全不一样。去年的这个时候,从文心一言到智谱,整体能力和GPT-4根本不在一个水平线上,那种感觉就好像幼儿园的学生和初中生在比知识储备,差距悬殊。
但是今年,咱们的一批国产大模型进步都非常快。在得到内部使用的过程中,OpenAI的GPT-4无疑还是最强的,但是从Kimi、通义、智谱等国产大模型的表现来看,更像大家都在一个初三班里,GPT-4是班里的学霸,在某一学科总考第一名,但其他同学完全有了一拼之力。甚至在一些领域里,学霸的能力还不如其他同学。
其实从之前移动支付的普及,也能明显看出来,我们在很多领域中,并没有难以割舍的历史包袱,反而更容易去拥抱新的技术。再加上我们的市场非常多样化,反而有更多AI渗透的机会。毕竟前几年有大批公司,纷纷喊着要做数字化转型,但都做得不咋滴。这回AI来了,就可以忘掉数字化转型这回事,直接做人工智能转型了。
好,今天的快刀广播站就到这里了。如果你觉得今天的内容对你有帮助,欢迎分享到朋友圈或者转发给你的朋友们。明天咱们接着聊AI。