免费的GPT-4o足够强，但治欠好OpenAI的产物焦虑-商品期货

来源：富士期货作者：富士国际期货时间：2024-05-14 07:42

5月14日破晓1点，继OpenAI在AI搜索上“虚晃一枪”之后，让萨姆·奥尔特曼（Sam Altman）感受“像魔术一样”的新模子终于浮出水面。

不是GPT-5，不是AI搜索，而是最新旗舰天生式AI模子GPT-4o！

GPT-4o（“o”代表“omni”，意为“万能的”）是迈向更自然的人机交互的一步——它接受文本、音频和图像的随便组互助为输入，并天生文本、音频和图像的随便组合输出。

整场宣布会时长仅30分钟，OpenAI CTO米拉·穆拉蒂（Muri Murati）带来主题演讲。“这是我们*次在易用性方面真正迈出一大步。”穆拉蒂在公司旧金山总部的现场演示中说道， “这种互动变得加倍自然，也加倍容易。”

值得注重的是，此次宣布会OpenAI CEO萨姆·奥尔特曼并未现身。在OpenAI官网披露的GPT-4o孝顺者中，依然没有看到OpenAI首席科学家伊利亚·苏茨克维尔（Ilya Sutskever）的身影。

1.“GPT-4o是我们*的模子”

整场宣布会的主角，就是OpenAI最新旗舰天生式AI模子GPT-4o。

OpenAI官网博客显示，GPT-4o（“o”代表“omni”）是迈向更自然的人机交互的一步。它接受文本、音频和图像的随便组互助为输入，并天生文本、音频和图像的随便组合输出。

相比今年2月的Sora， OpenAI此次宣布显得更有诚意——GPT-4o将免费提供应所有用户使用，Plus用户则可以享受到5倍的挪用额度。

穆拉蒂示意，GPT-4o将提供与GPT-4一致水平的智能。

同时，GPT-4o的运行速率大大提升，*亮点在于其语音交互模式接纳了全新手艺，让谈天机械人对话的响应速率大幅提升。OpenAI官网博客显示，GPT-4o在谈话中对音频输入的平均响应时间为320毫秒，最短的响应时间为232毫秒，与人类的响应时间相似。

GPT-4o另有超高的“语言先天”，能支持50种语言，并显着提高了非英语语言的性能，包罗改善分词器以更好地压缩其中的许多语言：

凭证传统基准测试，GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级其余性能，同时在多语言、音频和视觉功效上设置了新的高水位线。

开发职员现在可以在API中接见GPT-4o。与GPT-4 Turbo相比，GPT-4o速率提高2倍，价钱降低一半，速率限制提高5倍。

在现场演示环节，GPT-4o更是展现了各种花式操作——它能凭证演示者的实时要求变换语音语调，演绎话剧；能实时读图；甚至还跟演示者们开起玩笑，唱起歌。

此外，OpenAI还宣布了桌面版的ChatGPT和新的用户界面。

用户可以向ChatGPT（由 GPT-4o 提供支持）提出问题，并在ChatGPT回覆时打断它。OpenAI示意，该模子提供“实时”响应能力，甚至可以感知用户声音中的情绪，从而天生“一系列差异情绪气概”的声音（包罗唱歌）。

GPT-4o还升级了ChatGPT的视觉能力。给定一张照片或一个桌面屏幕，GPT-4o可以快速回覆相关问题，主题局限包罗“此软件代码中发生了什么？”到“这小我私人穿什么牌子的衬衫？”

“我们熟悉到这些模子正变得越来越庞大，” 穆拉蒂说道，“但我们希望用户与人工智能模子的交互体验能够加倍自然、轻松，让用户可以将注重力完全集中在与模子的协作上，而无需在意界面自己。”

穆拉蒂还透露，未来几周内，GPT-4o将分阶段集成至OpenAI的各个产物之中，而且会在ChatGPT Plus中推出新版语音模式GPT-4o的alpha版。

OpenAI研究员威廉·费达斯（William Fedus）示意：“GPT-4o是我们*进的新前沿模子。我们一直在LMSys arena上测试一个版本im-also-a-good-gpt2-chatbot。”

“这不仅是天下上*的模子，而且可以在ChatGPT中免费使用，这对于前沿模子来说是亘古未有的。”费达斯弥补道，“我们发现在更难的提醒集上——稀奇是编码——存在更大的差距：GPT-4o比我们之前的*模子实现了 100 ELO。”

奥尔特曼也在X上示意：“GPT-4o是我们*的模子。”

OpenAI此次宣布险些在想尽设施“讨好”用户，在“交互体验”上下足了功夫，直接免费开放使用更让用户感受到了OpenAI的诚意。

但「甲子光年」发现，在这种诚意背后，这家已被捧上神坛的AI创业公司，正深陷于某种焦虑之中。

2.OpenAI的产物焦虑

虽然奥尔特曼今天并未加入，但5月11日，他便亲自下场预告。可是，翻翻谈论区，网友们的关注点似乎有点儿跑偏。

有人喊话奥尔特曼让OpenAI首席科学家伊利亚回归：

有人体贴GPT-5到底何时宣布：

伊利亚的去向和GPT-5的宣布是OpenAI留给外界的两大谜题，也是外界最体贴的两大问题。

2024年，人们对OpenAI*的期待即是GPT-5。然而，每当奥尔特曼在访谈中被问及GPT-5相关进度时，却总是支支吾吾、讳莫如深。奥尔特曼在普罗民众心中的画像也逐渐从一位开天辟地的怪力少年，转变为一个在各国政客间长袖善舞，在种种场所大打太极的“成熟企业家”。

更致命的是，ChatGPT和GPT-4之后，OpenAI似乎一直没能推出相同重量级的AI产物，这些都在不停消磨外界对OpenAI的期待与信心。

首发| 眼健康消费企业「中景纬视」获数千万元Pre-A轮融资

今年2月，OpenAI宣布Sora——1份手艺讲述、32篇引用论文、一些画面堪比影戏镜头的demo和1个故作高深的“天下模拟器”看法就是OpenAI给出的所有，没有手艺论文，也没有可公然体验的产物入口。

「甲子光年」曾向多位AI从业者提问：“ChatGPT和Sora，谁带给你的震撼更大？”列位受访人险些不约而同地回覆：“Sora有震撼，但没ChatGPT的震撼大。”

造成这种感官差异的直接缘故原由是，ChatGPT能直接体验，但Sora不能。虽然ChatGPT也会犯一些荒唐的错误，但真实的交流感带给人们的震撼，远远大于只可远观、不能上手体验的Sora。甚至不少声音最先预测，Sora优美的Demo或许是工程师在背后频频微调的效果，Sora实时交互的效果“可能远不云云”。

对于外界的预测、质疑，OpenAI并未回应，而是迅速扔出下一个“靶子”——AI搜索。

已往一周，外媒不停有新闻传出OpenAI将推出AI搜索产物，更有媒体预测，谷歌一年一度的I/O大会即将于5月14日举行，而OpenAI此举是针对谷歌的精准偷袭。

OpenAI Search 测试界面，图片泉源：赛博禅心

不外，AI搜索的热度炒了半天，所谓的AI搜索产物最终只是虚晃一枪。

昆仑万维董事长兼CEO方汉近期在一次直播中直言：“我以为搜索引擎对于OpenAI的用户增进也不会有基个性的转变。”有数据显示，从去年5最先，ChatGPT的C端增进便逐渐触顶。

而产物焦虑一日不解，OpenAI距离“伟大的公司”就永远有一墙之隔。

3.GPT-4o能治好吗？

今天再次复盘ChatGPT的乐成会发现，这是一次不能复现的“无心插柳”。

2022年中，OpenAI最先训练GPT-4。半年后的11月30日，OpenAI宣布ChatGPT，全球各界都为之哆嗦。

OpenAI内部曾对是否宣布ChatGPT有过很长一段时间争论，由于谁都无法100%确认这是准确的事情。

彼时，OpenAI对自己的定位是一家为开发职员和企业构建工具的公司，而非直接面向普罗民众。因此，OpenAI要面临的焦点挑战，是ChatGPT的使用门槛是否足够低，以至于能让完全不懂手艺的人用起来。

在此之前宣布的视觉模子DaLL-E已经让OpenAI尝到了甜头。但ChatGPT能复制DALL-E的乐成吗？

奥尔特曼是名副实在的“冒险派”，他激励公司宣布ChatGPT，“实验一下”。在他看来，用户和模子举行文本形式的交互会发生一些很主要的个性化效果。

很快，用户的热情证实，这次试验无比乐成。从2022年11月上线的*个完整月（2022年11月）最先，到12月这一数字到达了2.66亿人次，月环比增进了近75%。到2023年1月，总接见量翻了一番多，到达6.16亿人次，2月就首次突破10亿人次大关。

这突如其来的乐成，在OpenAI的意料之外。

“我们并没有以为GPT-3系列模子已经跨越了将其应用于消费者或企业的门槛，本以为GPT-4会成为*个跨越这道门槛的模子，以是我们的许多设计和展望都是围绕2023年3月宣布GPT-4来放置的。”OpenAI COO 布拉德·莱特凯普（Brad Lightcap）此前在英伟达2024 GTC大会上分享道。

根据莱特凯普的说法，OpenAI用了6个月来顺应ChatGPT的爆炸性增进，并确保公司有足够的GPU来知足用户的需求。

直到2023年后半年，OpenAI最先感受到了来自行业一线的真实需求。OpenAI曾宣布，停止2023年8月，80%的财富500强公司已接纳ChatGPT。80%的统计数据是指拥有注册ChatGPT帐户的财富500强公司的百分比，由与企业电子邮件域关联的帐户确定。

于是，OpenAI迅速行动。2023年8月28日，OpenAI推出ChatGPT Enterprise，正式进军企业市场。它提供企业级平安和隐私、无限的高速GPT-4接见、用于处置更长输入的更长上下文窗口、高级数据剖析功效、自界说选项等等。

这是一个很玄妙的时间点——ChatGPT流量见顶，最先走下坡路。

凭证第三方网站SimilarWeb的监测数据，2023年6月ChatGPT的网站与移动客户端的全球流量（PV）环比下降9.7%，美国区域的流量环比下降10.3%。同时，ChatGPT的自力访客数目（UV）下降了5.7%，访客在网站上破费的时间也下降了8.5%。

这是自2022年11月30日宣布以来，ChatGPT首次泛起流量负增进。实在，ChatGPT增进放缓的势头在2023年5月已经泛起眉目，5月的增进率仅为2.8%。

那时，。“大部门人都是带着体验的目的，看看ChatGPT到底有多壮大才去注册的，包罗我也是。但这不意味着我会天天用它。除了做一些简朴的科普，或者给孩子写作文之外，大部门人一样平常实在也不太会用到。”这位AI Lab认真人说。

莱特凯普自己也在一次访谈中犀利点评ChatGPT：“人们玩儿过一会儿后就以为它并不是真正的工具，而更像一个玩具。”

更严重的是，ChatGPT的烧钱速率同样出人意料。

当OpenAI的早期投资人埃隆·马斯克（Elon Musk）问到ChatGPT的成本时，奥尔特曼给到的数据是“每次对话的平均用度为几美分”。2023年4月，外洋一位剖析师估算的数据则是天天的运营成本高达70万美元。

2023年2月1日，OpenAI最先商业化探索，推出付费版本的ChatGPT Plus，订价每月20美元，提供的增值服务包罗“岑岭时段免排队、快速响应以及优先获得新功效”等。

云云看来，ChatGPT虽然备受喜欢，但在商业层面，却算不上一个真正乐成的产物。这些被ChatGPT烧掉的钱，就要用B端来填。

数据显示，住手2023年11月，已经有92%的500强企业以某种形式部署ChatGPT。Block、Canva、Carlyle、雅诗兰黛、普华永道和Zapier均为OpenAI的早期客户。

C端流量与B端客户量的此消彼长之间，OpenAI也逐渐由一家伟大而名誉的非营利性AGI实验室，加速转变为一家“平庸”的商业公司——他们或许能赚到许多钱，却没有造出能够说服用户的产物。

直到今天，让奥尔特曼感应“像魔术一样”的GPT-4o面世。

只是GPT-4o真能治好OpenAI的产物焦虑吗？谜底或许并不清晰。

从模子能力上来看，实时语音交互是GPT-4o在多模态方面最亮眼的希望。然而事实上，语音交互类产物并不新鲜。在可查阅的历史中，AI语音交互类产物在商业化方面并没有太多乐成的案例，苹果的Siri到今天都是一个十分鸡肋的功效。

而宣布会上的GPT-4o，看起来依然是一个“有趣的玩具”。

从“无心插柳”的ChatGPT，到“只可远观”的Sora、“虚晃一枪”的SearchGPT，再到今天的GPT-4o，都只是OpenAI向天下展示其AI能力的“半制品”，而并非一个真正能够说服用户的商业产物，这在某种水平上限制了OpenAI用户的增进。

固然，不能否认的是，从这次宣布会的效果来看，GPT-4o或许会成为又一个乐成的PR案例，被写入OpenAI的历史。

香港富士期货有限公司

金融期货

免费的GPT-4o足够强，但治欠好OpenAI的产物焦虑-商品期货