146｜斯坦福AI团队被曝抄袭后跑路，国产大模型已经非常能打

伙伴们，快刀广播站又开始广播了。

最近AI领域一个比较大的瓜，是一个由三个斯坦福学生组成的AI团队，发布了一个开源模型，叫做Llama3-V。一发布就受到了非常大的关注，毕竟顶着斯坦福AI团队的头衔，发布的又是一个多模态的开源模型，所以就成为了风云人物。

但是，发出来之后就特别好玩了，先是被网友扒出来里面的很多具体实现方式，与中国大模型公司面壁智能的MiniCPM-V系列开源模型非常相似。随着找到的证据越来越多，这三个人直接就把模型删库跑路了。

随后，面壁智能的首席科学家、清华大学的刘知远教授经过调查，拿出了一个重量级的证据，就是这个模型对清华简的识别能力。什么是清华简呢？这指的是清华大学收藏的一批战国时期的竹简，这些竹简是在2008年由清华大学校友捐赠给学校的，因此被称为清华简。里面内容非常丰富，包括了古代的历史文献、辞赋等等。要知道，这批竹简的识别能力，是面壁智能做的一个彩蛋功能，因为这是用他们逐字扫描清华简后，人工标注的数据集训练的，从来没有对外面公开过。而这个斯坦福团队的开源模型，识别这批清华简，做对的题和做错的题，都跟面壁智能的模型一模一样。这就好比考试时，连同桌的名字都抄上了。

这件事情让我想起了早年输入法大战时，搜狗输入法把一个对手告上了法庭，理由就是抄袭。当时，搜狗输入法有个小众词库，是把搜狐全体员工的名字加到了系统词库里。举个例子，今年刚拍了《年会不能停》的大鹏，本名叫董成鹏，当时还是搜狐娱乐的一个编辑。那么除了搜狗输入法，其他输入法都不应该在打完这三个字的拼音后，直接出现“董成鹏”三个字。这就在当时被拿出来当作了证据。是不是和今天这个事件，有异曲同工之妙。

我们回到这次大模型的抄袭事件，被人实锤之后，这个团队的三个人马上就各自飞了。其中两名斯坦福的本科生悉达多和阿克什发了致歉推文，核心意思是我们三个看起来是一个团队，其实我俩只负责在网上推广这个模型，是另外一个人穆斯塔法写了所有的代码，但现在我们已经联系不到他了。

穆斯塔法在推特上开启了保护锁定，其他人都不能关注他或看到他的内容。连斯坦福人工智能实验室的主任都看不下去了，发文说这个团队居然还不承认自己的抄袭，还在找借口甩锅。

这件事情到这里基本告一段落，不过它也引发了不少技术社区的讨论。讨论的焦点不在抄袭本身，而在于是否忽视了中国AI领域的发展。要知道，面壁智能被抄袭的模型，是通过这种方式才被很多业内人士关注到的。核心还是因为那个抄袭的团队，顶着斯坦福AI团队的帽子，就让人先入为主地认为他们一定很厉害。

大家如果关注媒体报道，就会发现去年五六月份，采访大佬们时最常问的问题是“我们离GPT-4的水平还差几年？”但是今年已经很少有记者这么问了。作为一个AI学习者，我今年的感受也跟去年完全不一样。去年的这个时候，从文心一言到智谱，整体能力和GPT-4根本不在一个水平线上，那种感觉就好像幼儿园的学生和初中生在比知识储备，差距悬殊。

但是今年，咱们的一批国产大模型进步都非常快。在得到内部使用的过程中，OpenAI的GPT-4无疑还是最强的，但是从Kimi、通义、智谱等国产大模型的表现来看，更像大家都在一个初三班里，GPT-4是班里的学霸，在某一学科总考第一名，但其他同学完全有了一拼之力。甚至在一些领域里，学霸的能力还不如其他同学。

其实从之前移动支付的普及，也能明显看出来，我们在很多领域中，并没有难以割舍的历史包袱，反而更容易去拥抱新的技术。再加上我们的市场非常多样化，反而有更多AI渗透的机会。毕竟前几年有大批公司，纷纷喊着要做数字化转型，但都做得不咋滴。这回AI来了，就可以忘掉数字化转型这回事，直接做人工智能转型了。

好，今天的快刀广播站就到这里了。如果你觉得今天的内容对你有帮助，欢迎分享到朋友圈或者转发给你的朋友们。明天咱们接着聊AI。

Leave a Comment Cancel Reply