119｜OpenAI发布科幻级别超强模型，拆解新品的六个细节和对得到的启示

伙伴们，快刀广播站又开始广播了。

今天凌晨，也就是咱们北京时间5月14日的凌晨，OpenAI又放出了大招。他们在自己历史上第一次“春季新品发布会”上放出了新模型。虽然不是之前想象中的GPT5，但是依然非常震撼。

我之前介绍过一批讲人工智能的科幻电影，里面有一部叫做《Her》的，在2013年上映。故事的男主人公西奥多，是一名作家，职业呢，是帮那些不善于表达的人写情书。好吧，看到这里的时候我想起自己在高中的时候，这也是我的业余收入，帮人写一封情书收10块钱。所以我特别能理解，他一方面要承受和妻子分手之后的悲伤，一方面还要帮人写情书。

接下来他遇到了一个名叫萨曼莎的女性操作系统，这个萨曼莎非常善解人意，能和人对话，并且能不断地学习和进化，所以两个人就从人机对话，变成了真正的人机网恋。这个电影感兴趣的同学可以去看一下，要知道当时电影里设想的这件事情，就发生在2025年。

而今天，OpenAI以一己之力把科幻电影里的情节带到了我们眼前，并且还提前了一年，以至于连OpenAI自己的CEO奥尔特曼都要在社交媒体上惊呼一声这部电影的名字，《Her》，意思就是这简直跟电影一样。

因为OpenAI的新模型名叫GPT-4o，这个字母o代表的单词就是“Omnimodel”，意思就是全能模型。啥模型能叫全能模型呢？就是他们在这一个模型里集合了所有的模态，覆盖了文本、视觉和音频。光听我这么说的话有点抽象，我跟你描述一下发布会里的场景。

在现场，OpenAI的工程师拿出一个iPhone，他对手机说：“我第一次来直播的发布会，有点紧张。”ChatGPT说：“要不你深呼吸一下。”然后他深呼吸了一下，AI马上说：“你这不行，喘得声音也太大了。”

这种感觉非常科幻了，简直就跟自己的朋友面对面聊天一样。如果你经常使用AI语音助手，那么就能明显发现OpenAI的颠覆性所在。我给你分享下我观察到的六个细节：

第一个细节，这是实时语音，你不用说完话，像傻子一样等着AI加载或者反应。这个模型可以在232毫秒的时间内响应音频输入，这就和人类的反应时间很相似了。

第二个细节，你可以随时打断它，不用非要等它说完就可以继续说下去。之前我们用其他产品的时候，经常在AI说第一句话时，我们就知道不是我们想要的结果，但是必须要等它喋喋不休地说完，或者是手动操作让AI停止输出，一下子就让你出戏了。

但是OpenAI这次的模型里，你可以直接打断，说你想说的就可以了，它会继续接你的话往下聊。就好像你对面的朋友开始跟你抱怨领导的时候，刚说第一句，你就说“咱俩还是聊聊足球吧。”它就会跟你继续聊新的话题。

第三个细节，你记得刚才那个演示吗？工程师深呼吸，AI说“你这喘得也太大了”。要知道，工程师没有说话，AI感受到了呼吸的节奏，回复的话也非常像真人，而不是像一些AI回复得很生硬，任何时候都要给你讲300字的知识库里的道理。

第四个细节，另一位工程师在纸上写了一个方程式，让ChatGPT不直接给答案，而是解释一步步怎么做。包括给AI看一些代码和图表，AI都可以对答如流。光这个细节，就给我们很大的想象空间了。例如在很多教育场景，这个一步步教学的感觉，可以24小时随时待命，我相信对学校教育或者是职业培训都会产生翻天覆地的变化。

例如程序员工作的场景，以前有个名词叫“结对编程”，就是两个程序员结成小时候那种学习小组，坐在一起写代码，等于有人讨论、有人提醒，也有人帮你检查。而现在，每个程序员都可以配上一个自己的写代码搭子了。

第五个细节，给AI一段视频，它能识别出中间人物的表情。当然，这个视频比较短，但是想象空间依然非常大。例如AI识别到你的不同情绪，然后用不同的方式来跟你互动对话，你开心、愤怒、沮丧、无聊时，它都可以非常体贴地陪着你。

要知道现在不管是职场还是中小学，心理问题出现得比以前多，所以很多中小学都要求必须配备心理医生。但是很多学校上千孩子，只有一个心理医生，很难覆盖到其他大部分有潜在心理问题的孩子。更主要的是，这样的孩子对心理医生会有本能的抗拒。但是如果有这么一个AI心理医生，可以去疏导孩子的情绪，甚至在孩子沟通过程中，情绪出现了重大波动，完全可以启动应急方案，让更专业的医疗机构和学校介入，以免发生让人心疼的极端自杀事件。

第六个细节是，你可以跟一张图片进行对话。怎么说呢，例如你打开冰箱，拍张照片，直接跟AI说：“这顿饭可以做什么？”然后它就可以给你输出一个按照冰箱里的菜而出的菜谱，整个交互非常丝滑。但是你想啊，在刚才这个简单的流程中，有语音输入、图片输入，还有菜谱的文本输出。

那以后当AI帮你记录的东西足够多的话，你出去遇到一个熟人，但是完全忘记他是谁的这种情况，你只要拍一张照片，AI就能调出历史记录，帮你回忆起你是在什么时候认识他的，你们之间发生过什么事情，等等，让你不再成为一个脸盲。

当然，除了这个全能模型的发布，OpenAI还发布了电脑版应用，其实就是希望能覆盖你工作生活的各个场景，这对上班族来说非常友好了。

这个全能模型，说实话让我非常振奋，因为有很多场景接下来都可以从梦想变成现实了。例如得到学习助手接入了这个模型接口，那么当你想起某本书的时候，你就直接语音问它：“这本书讲了什么？里面特别有意思的案例是什么？有没有什么金句？”

当你看到一篇网文的时候，你可以直接问AI，“这句话真是鲁迅说的吗？”AI在对面回答你，“不，鲁迅没说过。”

当你跑步散步时，突然有个想法的时候，直接说：“帮我记下一条笔记。”AI马上说：“没问题，你说吧，我听着。”

当你看到一个知识点时，你问AI：“我以前有没有记过类似的笔记？帮我找出来。”AI直接说：“你以前一共记过六条笔记，都跟这个知识点有关。”

对，我希望这些场景在今年的得到学习助手里就能实现。毕竟OpenAI已经把科幻片变成了现实，我们只需要摸着他们过河就可以了。

好，今天的快刀广播站就到这里了。刚才设想的这些得到学习助手的AI场景，也希望你能关注和监督我们早日实现。

如果你觉得今天的内容对你有帮助，欢迎分享到朋友圈或者转发给你的朋友们。

Leave a Comment Cancel Reply