伙伴们,快刀广播站又开始广播了。
从去年到现在,AI很多领域都进展飞快。例如前段时间,AI音乐制作软件Suno的V3版本向所有用户免费开放,就让很多像我这样五音不全、毫无音乐细胞的人,也可以在一两分钟内生成一首听起来还不错的原创歌曲。很多同学学完Suno教程课后都分享了自己的音乐作品,欢迎大家到文稿区围观,更欢迎你也上手创作。
不过话说回来,正因为AI在各个领域发展过快,所以也出现了不少“道高一尺、魔高一丈”的现象。
举个例子,用AI写论文已经不是啥稀罕事了,不仅是学生的毕业论文,还包括学者提交的论文。国内外最近就出现了学者发表的论文,忘记删去明显带AI语言风格内容的情况。但AI可不仅仅是用在写论文上,最近康奈尔大学推出了一个自动评审论文的AI模型,通过让AI生成详细的评审内容来提升同行评审水平。
怎么理解呢?每篇论文在正式发表前,通常会经历一个叫同行评审的环节。康奈尔大学的这个论文评审AI模型,包含了一个大规模数据集,汇总超过27000篇论文,和跟这些论文相对应的99000条评审意见,对AI进行训练。这个模型比较有创意的地方是,把论文评审过程分成两个步骤,步骤一是让大模型先分析一遍论文,生成一组评审时应该注意的要点。然后把评审要点作为指令,再带着论文全文进入到第二个步骤,就是让大模型进行完整的评审,其实就相当于步骤一是给论文画靶子,步骤二开始对着靶子射箭。
对于这个名字叫做REVIEWER 2的评审模型,团队说它在多个指标上,跟人类同行的评审意见接近。不过,这样的应用场景,也面临着伦理争议,就是AI会不会替代人类评审员。研究团队负责人说自动化评审,其实是想帮助论文作者在进入正式的人类评审环节前,提高论文质量。
不过说实话,我倒觉得,未来的论文评审,可以更多结合AI评审的意见。比如AI跟人类评审的意见各占一部分权重。因为毕竟人难免可能有偏向性,或者是有疏忽,像那些评估论文基础研究质量的维度,就可以交给AI。而人类专家的精力,就可以更多花在论文研究方向到底有没有价值这件事上。
这项研究,如果结合斯坦福一个团队的研究来看,会更有意思。因为康奈尔大学的研究团队不希望大家认为自己的AI评审模型会抢人类评审员的工作。不过斯坦福团队的最新研究发现,有6.5%到16.9%的同行评审意见,可能就是由AI生成的,或者AI协助进行过修改。
因为他们研究了ChatGPT发布之后的几篇著名AI大会的论文,发现部分特定形容词出现的频率大幅提升。例如“值得称赞的”“细致的”“复杂的”这几个词,在论文里出现的概率分别增加了9.8倍,34.7倍和11.2倍。另外,如果是在审稿截止日期最后3天提交的评审意见,里面使用ChatGPT的比率高很多。
看到这个结果,我一点也不吃惊,这种结果还需要斯坦福团队来研究吗?任何一个赶过寒暑假作业的同学都知道,开学前那三天补作业的时候,肯定是有啥抄啥。
AI兴起之后,产生了很多意料不到的机会,例如之前有了美颜相机,就有人去研发去美颜的真实相机。而现在,有人用AI写论文,就有人在研究用AI帮人评审论文,我猜肯定还有团队正在研究论文的“含AI率”,以前论文关注的都是查重率,现在AI来了,大家都不会直接复制原文了,而是让AI发挥一段原创文字,所以未来一篇论文的“含AI率”估计会被列入评审标准。
现在,AI生成的图像和视频足够以假乱真,所以反向研究识别AI图片,也会成为一个创业方向。这让我想起上周遇到的一件事,一位创业朋友咨询我,有没有什么AI工具,可以一次性批量阅读公司两百多位同事的周报,然后帮忙列出要点,提升阅读效率。当时我听到这个需求,有点哭笑不得,因为现在国内大模型宣传最多的三个功能,一个是写诗,一个是写小红书文案,还有一个就是写周报了。打工人用AI写周报,老板用AI看周报,这个完美的内卷循环除了浪费宝贵的推理算力之外,有什么意义呢?
这位朋友后来跟我反馈说,已经取消写周报了,变成有事要同步的人写周报,写不写全凭自觉。我觉得这么改特别好,AI时代,很多传统的做事方式或者流程,都值得突破和迭代。AI已经在疯狂进化了,咱们个人和组织也不能落后太多。
最后提醒一下,今晚8点,咱们AI学习圈直播间又请来一位实干家,是卫瓴科技的创始人兼CEO杨炯纬老师。他是非常成功的连续创业者,在这波AI浪潮中选择了营销这个红海赛道。他会来分享,AI时代,销售、市场营销等岗位会发生什么变化,欢迎你现在就打开文稿预约,不见不散。
好,今天的快刀广播站就到这里了。如果你觉得今天的内容对你有帮助,欢迎分享到朋友圈或者转发给你的朋友们。明天咱们接着聊AI。
点击预约杨炯纬老师直播
点击查看学习圈同学的AI音乐作品