伙伴们,快刀广播站又开始广播了。
今天凌晨,也就是咱们北京时间5月14日的凌晨,OpenAI又放出了大招。他们在自己历史上第一次“春季新品发布会”上放出了新模型。虽然不是之前想象中的GPT5,但是依然非常震撼。
我之前介绍过一批讲人工智能的科幻电影,里面有一部叫做《Her》的,在2013年上映。故事的男主人公西奥多,是一名作家,职业呢,是帮那些不善于表达的人写情书。好吧,看到这里的时候我想起自己在高中的时候,这也是我的业余收入,帮人写一封情书收10块钱。所以我特别能理解,他一方面要承受和妻子分手之后的悲伤,一方面还要帮人写情书。
接下来他遇到了一个名叫萨曼莎的女性操作系统,这个萨曼莎非常善解人意,能和人对话,并且能不断地学习和进化,所以两个人就从人机对话,变成了真正的人机网恋。这个电影感兴趣的同学可以去看一下,要知道当时电影里设想的这件事情,就发生在2025年。
而今天,OpenAI以一己之力把科幻电影里的情节带到了我们眼前,并且还提前了一年,以至于连OpenAI自己的CEO奥尔特曼都要在社交媒体上惊呼一声这部电影的名字,《Her》,意思就是这简直跟电影一样。
因为OpenAI的新模型名叫GPT-4o,这个字母o代表的单词就是“Omnimodel”,意思就是全能模型。啥模型能叫全能模型呢?就是他们在这一个模型里集合了所有的模态,覆盖了文本、视觉和音频。光听我这么说的话有点抽象,我跟你描述一下发布会里的场景。
在现场,OpenAI的工程师拿出一个iPhone,他对手机说:“我第一次来直播的发布会,有点紧张。”ChatGPT说:“要不你深呼吸一下。”然后他深呼吸了一下,AI马上说:“你这不行,喘得声音也太大了。”
这种感觉非常科幻了,简直就跟自己的朋友面对面聊天一样。如果你经常使用AI语音助手,那么就能明显发现OpenAI的颠覆性所在。我给你分享下我观察到的六个细节:
第一个细节,这是实时语音,你不用说完话,像傻子一样等着AI加载或者反应。这个模型可以在232毫秒的时间内响应音频输入,这就和人类的反应时间很相似了。
第二个细节,你可以随时打断它,不用非要等它说完就可以继续说下去。之前我们用其他产品的时候,经常在AI说第一句话时,我们就知道不是我们想要的结果,但是必须要等它喋喋不休地说完,或者是手动操作让AI停止输出,一下子就让你出戏了。
但是OpenAI这次的模型里,你可以直接打断,说你想说的就可以了,它会继续接你的话往下聊。就好像你对面的朋友开始跟你抱怨领导的时候,刚说第一句,你就说“咱俩还是聊聊足球吧。”它就会跟你继续聊新的话题。
第三个细节,你记得刚才那个演示吗?工程师深呼吸,AI说“你这喘得也太大了”。要知道,工程师没有说话,AI感受到了呼吸的节奏,回复的话也非常像真人,而不是像一些AI回复得很生硬,任何时候都要给你讲300字的知识库里的道理。
第四个细节,另一位工程师在纸上写了一个方程式,让ChatGPT不直接给答案,而是解释一步步怎么做。包括给AI看一些代码和图表,AI都可以对答如流。光这个细节,就给我们很大的想象空间了。例如在很多教育场景,这个一步步教学的感觉,可以24小时随时待命,我相信对学校教育或者是职业培训都会产生翻天覆地的变化。
例如程序员工作的场景,以前有个名词叫“结对编程”,就是两个程序员结成小时候那种学习小组,坐在一起写代码,等于有人讨论、有人提醒,也有人帮你检查。而现在,每个程序员都可以配上一个自己的写代码搭子了。
第五个细节,给AI一段视频,它能识别出中间人物的表情。当然,这个视频比较短,但是想象空间依然非常大。例如AI识别到你的不同情绪,然后用不同的方式来跟你互动对话,你开心、愤怒、沮丧、无聊时,它都可以非常体贴地陪着你。
要知道现在不管是职场还是中小学,心理问题出现得比以前多,所以很多中小学都要求必须配备心理医生。但是很多学校上千孩子,只有一个心理医生,很难覆盖到其他大部分有潜在心理问题的孩子。更主要的是,这样的孩子对心理医生会有本能的抗拒。但是如果有这么一个AI心理医生,可以去疏导孩子的情绪,甚至在孩子沟通过程中,情绪出现了重大波动,完全可以启动应急方案,让更专业的医疗机构和学校介入,以免发生让人心疼的极端自杀事件。
第六个细节是,你可以跟一张图片进行对话。怎么说呢,例如你打开冰箱,拍张照片,直接跟AI说:“这顿饭可以做什么?”然后它就可以给你输出一个按照冰箱里的菜而出的菜谱,整个交互非常丝滑。但是你想啊,在刚才这个简单的流程中,有语音输入、图片输入,还有菜谱的文本输出。
那以后当AI帮你记录的东西足够多的话,你出去遇到一个熟人,但是完全忘记他是谁的这种情况,你只要拍一张照片,AI就能调出历史记录,帮你回忆起你是在什么时候认识他的,你们之间发生过什么事情,等等,让你不再成为一个脸盲。
当然,除了这个全能模型的发布,OpenAI还发布了电脑版应用,其实就是希望能覆盖你工作生活的各个场景,这对上班族来说非常友好了。
这个全能模型,说实话让我非常振奋,因为有很多场景接下来都可以从梦想变成现实了。例如得到学习助手接入了这个模型接口,那么当你想起某本书的时候,你就直接语音问它:“这本书讲了什么?里面特别有意思的案例是什么?有没有什么金句?”
当你看到一篇网文的时候,你可以直接问AI,“这句话真是鲁迅说的吗?”AI在对面回答你,“不,鲁迅没说过。”
当你跑步散步时,突然有个想法的时候,直接说:“帮我记下一条笔记。”AI马上说:“没问题,你说吧,我听着。”
当你看到一个知识点时,你问AI:“我以前有没有记过类似的笔记?帮我找出来。”AI直接说:“你以前一共记过六条笔记,都跟这个知识点有关。”
对,我希望这些场景在今年的得到学习助手里就能实现。毕竟OpenAI已经把科幻片变成了现实,我们只需要摸着他们过河就可以了。
好,今天的快刀广播站就到这里了。刚才设想的这些得到学习助手的AI场景,也希望你能关注和监督我们早日实现。
如果你觉得今天的内容对你有帮助,欢迎分享到朋友圈或者转发给你的朋友们。
相关链接:
YouTube上发布会演示视频:https://www.youtube.com/@OpenAI
https://mp.weixin.qq.com/s/PfWnlhXh3n3VDfZaMI-ifQ