作者 | 小小
出品 | 网易科技
红色警报?那只是公司日常。IPO?抱歉,我一点都不想上。
就在全硅谷都以为OpenAI被谷歌逼急了的时候,奥特曼在最新的采访中,反手给唱衰者泼了一盆冷水。
没有焦虑,只有野心。在与科技博客主持人亚历克斯·坎特罗维茨(Alex Kantrowitz)的深度对话中,他首次揭开了“红色警报”的真相,回应了1.4万亿美元的疯狂账单。在他看来,现在的围剿根本不算什么,OpenAI不仅没有掉队,反而正在憋一个能让全人类“吓一跳”的大招。
但这番表态的份量,远超商业竞争本身。在他对万亿资本和超级智能的重新解构中,我们看到:
这不仅是一场关于生存的辩论,更是一次关于AI商业逻辑与人类未来的终极校准。
以下是本次访谈的深度拆解:
01. “红色警报”保卫战:用“疫情逻辑”屠掉竞争对手
当被问及“OpenAI是否已失去领先优势”时,奥特曼展现出了极其强悍的“战时CEO”本色。
(图片由AI生成)
在他看来,所谓的“红色警报”并不是恐惧,而是一种极度敏锐的防御机制。 他提出了一个耐人寻味的“疫情逻辑”:在疫情暴发初期,你采取的每一点细微行动,其价值都远超后期的疯狂补救。大多数人总是在后期才开始集体恐慌,而OpenAI要在火苗还没烧起来时就动用最高规格的“灭火器”。
(图片由AI生成)
(图片由AI生成)
这种“战时体制”通常只持续六到八周。奥特曼放出狠话:虽然全世界的模型都在变好,但ChatGPT的“马太效应”只会越来越强。这种自信背后,是OpenAI正在进行的“系统级碾压”——他们卷的不只是模型,而是一个由大脑(模型)、皮肤(界面)和骨骼(基础设施)组成的超级闭环。
02. 别逼我IPO:我根本不想当上市公司的CEO!
在访谈中,关于OpenAI什么时候上市的问题让无数投资人屏住呼吸,但奥特曼的回答却像一盆冷水:“我对成为一家上市公司的CEO感到兴奋吗?0%(一点也不)!”
奥特曼直言,由于需要天文数字般的资本投入,加上股东人数最终会突破法律限制,OpenAI最终可能不得不走向公开市场。但他对此表现得极其“嫌弃”,甚至认为这会非常“烦人”。
与那些急于套现的公司不同,奥特曼表示OpenAI即使要上市,也会比历史上任何一家伟大公司都晚得多。
虽然他承认公共市场参与价值创造很“酷”,但在他眼里,保持私有状态的灵活性对于冲刺“超级智能”至关重要。他更愿意把精力放在改变世界上,而不是盯着季报和股价。
03. 降维打击谷歌:把AI “缝合”进旧产品是自寻死路
谈到老对手谷歌,奥特曼的评价可谓刻薄:巨头正受困于其伟大的商业模式,这叫“创新者的窘境”。
他尖锐地批评了那种将AI生硬地“缝合”进搜索或办公软件的做法。在他眼里,未来的世界不该是你去查搜索结果,而是一个“全能智能体”能感知一切,并代替你做决策。
奥特曼甚至承认,他对ChatGPT过去三年的聊天界面变化之小感到“惊讶”。OpenAI正在憋大招:未来的界面不再是死板的对话框,而是能根据任务自动生成的、会进化的动态交互界面。
04. GDP-val预警:74.1%的专家任务已被AI攻陷?
如果说普通人在玩AI绘图,那奥特曼已经在关注AI替代顶级精英了。
(图片由AI生成)
他亮出了一个令知识界感到寒意的指标:GDP-val。这个OpenAI自研的基准显示,GPT-5.2 Pro在处理法律、PPT制作等40多个垂直领域时,在74.1%的知识工作任务中击败或打平了人类专家。
这意味着,人类正在从“生产者”转型为“机器人管理员”。奥特曼甚至设想了一个极具赛博朋克色彩的未来:如果全世界每个人都是AI公司的董事会成员,共同治理一个高效、客观的“AI CEO”,这难道不比现在的管理模式更合理吗?
05. 模型进化论:企业智能的“量子跃迁”与消费体验的温柔变革
OpenAI正在酝酿一场模型能力的“静默革命”。
奥特曼确认,2026年第一季度将推出比当前惊艳世界的GPT-5.2有“显著进步”的新模型。 这场升级的核心将围绕 “企业智能”的量子跃迁。
在企业端,新模型将在法律分析、金融建模、复杂编码等专业垂直领域展现出接近甚至超越人类专家的性能。而针对消费级市场,升级将更侧重于体验的流畅性、记忆的持久性和交互的自然度。
“消费者现在最想要的,不再是更高的智商。” 奥特曼的这句话揭示了OpenAI产品哲学的一个微妙转变:当基础智力达到一定阈值后,易用性、个性化和情感连接成为了新的竞争战场。
06. 战略大转弯:从“消费优先”到“企业优先”的无声转型
“今年是我们企业级增长超过消费级增长的一年。” 这句看似平淡的陈述,背后是OpenAI一次重大的战略转向。
(图片由AI生成)
这家以ChatGPT席卷全球消费市场的公司,正在将重心悄然转向企业服务。奥特曼表示,OpenAI正在通过API和深度定制化服务,构建一个面向企业的AI平台。
这个平台将满足企业在知识工作自动化、智能客户支持、金融风险分析乃至前沿科学研究等多个垂直领域的深度需求。
奥特曼提到,超过100万的企业用户已经接入,而API业务的增长速度甚至超过了现象级的ChatGPT本身。OpenAI正在证明,AI的商业化未来不仅在于与数十亿用户聊天,更在于重塑每一个行业的运作效率。
07. 1.4万亿美元豪赌:算力是通往新物理学的唯一门票
面对外界质疑1.4万亿美金的基础设施建设是“泡沫”,奥特曼表现出了异常的执着。
(图片由AI生成)
他提出了一个震撼的思维实验:现在一家头部AI公司每天生成的token,可能已经接近全人类每天输出的总和,未来这个数字是成千上万倍。这种智力的“大规模过剩”将直接引爆科学革命。
(图片由AI生成)
他最兴奋的不是写代码,而是利用这股排山倒海的算力去发现新物理、治愈绝症。奥特曼坚信,即便模型进步明天就停滞,现有的5.2系列表现出的“价值过剩”也足以支撑起一座万亿级别的商业帝国。
(图片由AI生成)
08. 别了AGI:我们要的是“统治级”的超级智能
访谈的最后,奥特曼做出了一个历史性的修正:抛弃AGI那个模糊的老生常谈,迎接“超级智能”。
(图片由AI生成)
在他看来,AGI这个词已经因为被过度讨论而失去了意义。他给出了一个极其硬核的标准:当一个系统能比任何人类辅助的团队,更好地担任总统、管理大型跨国实验室或指挥全球供应链时,它才是我们要寻找的“超级智能”。
(图片由AI生成)
结语
奥特曼试图用“超级智能”的远景,来消解当下“红色警报”的焦虑。
一边是谷歌步步紧逼的现实引力,另一边是1.4万亿美金堆砌的星辰大海。OpenAI正行走在这两者构成的钢丝之上。它既要应对世俗的商业围剿,又要维系那个近乎科幻的AGI承诺。
(图片由AI生成)
正如他在访谈最后所留下的悬念:未来的AI或许能治愈癌症,甚至胜任总统。
但这究竟是即将兑现的“能力爆发”,还是为了维持高估值而讲述的“超级叙事”?时间会给出最公正的答案。
以下是访谈实录(由AI翻译,网易编辑负责校对)
主持人:OpenAI首席执行官萨姆·奥特曼 (Sam Altman) 今日做客本节目,与我们探讨在日益激烈的AI竞赛中,OpenAI的制胜战略、基础设施投入的底层逻辑,以及OpenAI可能的IPO时间表。萨姆今天就在我们的演播室。萨姆,欢迎来到节目。
萨姆·奥特曼:谢谢邀请。
主持人:OpenAI已经成立十年了,这让我觉得有些不可思议。ChatGPT才三岁,但竞争正在加剧。随着Gemini 3的发布,我们所在的OpenAI总部正处于“红色警报” (code red) 状态。放眼望去,到处都有公司试图蚕食OpenAI的领先优势。这是我记忆中第一次,感觉这家公司似乎失去了明确的领先地位。我很想听听你对OpenAI将如何走出这一局面的看法。
萨姆·奥特曼:首先,关于“红色警报”,我们认为这是一种风险相对较低、但会经常采取的应对机制。当潜在的竞争威胁出现时,保持警惕并迅速行动是件好事。我们过去就经历过这种情况,今年早些时候与DeepSeek(深度求索)的竞争就是如此,当时也启动了“红色警报”。
流行病学领域有个说法:疫情之初你采取的任何行动,其价值都远超后期行动,但大多数人早期做得不够,事后才陷入恐慌——我在新冠疫情中确实看到了这一点。我基本上是秉持这种哲学来应对竞争威胁的。我认为保持一点偏执是好事。
Gemini 3目前(至少到目前为止)还没有产生我们担心的那种影响,但它确实像DeepSeek一样,暴露了我们产品策略上的一些弱点,我们正在非常迅速地解决这些问题。我认为我们不会在这种“红色警报”状态下待太久。从历史上看,这对我们来说通常是持续六到八周的事情。但我很高兴我们这么做了。
就在今天,我们发布了一款新的图像模型,这是一件很棒的事,也是消费者翘首以盼的。上周我们发布了GPT-5.2,反响极佳,增长也非常迅速。我们还会有其他一些产品要发布,同时也会有一些持续的改进,比如提升服务速度。我的猜测是,在未来很长一段时间里,我们每年大概会这样做一到两次,这正是确保我们在自己领域从容获胜的一部分。
很多其他公司也会做得很好,我为他们感到高兴。但ChatGPT目前仍然是市场上占据绝对主导地位的聊天机器人,而且我预计这种领先优势会随着时间推移而扩大,而非缩小。模型在各处都会变得更好,但人们使用一个产品(无论是消费级还是企业级)的原因,远不止模型本身。我们对此早有预料,因此我们努力构建一整套完整而协调的产品体系,以确保我们成为人们的首选。我认为竞争是好事,它能推动我们变得更好。我想我们在聊天领域会做得很好,在未来几年,企业级领域也会做得很好。对于其他新领域,我预计我们同样会表现出色。
我认为人们真的想使用一个统一的AI平台。人们在个人生活中使用手机,大多数时候也希望在工作中使用同类型的手机。我们在AI上也看到了同样的情况。ChatGPT在消费市场的强大实力,确实有助于我们在企业市场获胜。当然,企业需要不同的产品,但人们会想:我了解OpenAI这家公司,我知道如何使用ChatGPT这个界面。所以我们的战略就是:打造最好的模型,围绕它构建最好的产品,并拥有足够的基础设施来大规模提供服务。
主持人:没错,存在先发优势。ChatGPT在今年早些时候大约是4亿周活跃用户,现在有报道称已达8亿,接近9亿。但另一方面,像谷歌这样的公司拥有分发渠道的优势。我很好奇你的看法:你认为模型会“商品化”吗?如果会,什么才是最重要的?是分发渠道?是你构建应用的能力?还是我没想到的其他东西?
萨姆·奥特曼:我不认为“商品化”是思考模型的正确框架。不同的模型会在不同领域各有所长。对于与模型聊天的普通用例,也许会有很多很棒的选择。但对于科学发现,你可能会想要那种处于前沿、专为科学优化的模型。所以模型会有不同的优势,我认为最大的经济价值将由前沿模型创造,而我们计划在那里保持领先。我们非常自豪GPT-5.2是世界上最好的推理模型,也是科学家们取得最多进展的模型;同样,企业也认为它在完成商业工作所需的所有任务方面表现最佳。所以,我们有时会在某些领域领先,在其他领域落后,但我预计,即使在一个免费模型能胜任许多日常任务的世界里,整体上最智能的模型仍将具有重要价值。
产品本身至关重要,你提到的分发渠道和品牌也同样如此。以ChatGPT为例,个性化就极具用户粘性。人们喜欢模型能随着时间逐渐了解他们,你会看到我们在这方面大力投入。人们与这些模型有过体验后,会与它们建立起某种情感联系。我记得有人曾告诉我,你一生中大概只会认准一个牙膏品牌,然后就一直用下去。人们谈论ChatGPT时也是如此,他们有过一次神奇的体验。医疗保健就是一个著名的例子,人们把血检报告或症状输入ChatGPT,然后发现自己可能得了某种病,去看医生后,治好了一种以前无法诊断的病症。这样的用户粘性非常高,更不用说叠加其上的个性化功能了。
未来还会有各种产品层面的东西。我们最近刚发布了浏览器,我认为这为我们指明了一个全新的、潜力巨大的模式。硬件设备还比较遥远,但我对此非常兴奋。所以,我认为会有所有这些部分。而在企业领域,创造护城河或竞争优势的因素,我预计会有些不同。但在某种程度上,它类似于消费领域的个性化:企业会与我们这样的公司建立关系,他们会将自己的数据接入平台,并能够使用来自不同公司的一系列智能体,以确保信息得到妥善处理。我预计这也会非常有粘性。我们已经有超过100万企业用户,但人们大多仍将我们视为一家消费级公司。我们当然会大力进军企业市场。
主持人:方便分享一下数据吗?
萨姆·奥特曼:实际上,我们有超过100万企业用户,但我们的API (应用程序编程接口) 采用速度绝对是爆炸性的。对我们来说,今年API业务的增长速度甚至超过了ChatGPT本身。所以,企业级业务确实从今年开始真正发力了。
主持人:我能不能回到这个问题,如果“商品化”不是合适的词,也许对于日常用户来说,不同模型会趋于“同质化”?因为你开始回答时说,也许日常使用感觉相似,但在前沿领域感觉会非常不同。当谈到ChatGPT的增长能力时,我用谷歌举个例子。如果ChatGPT和Gemini对于日常使用感觉相似,而谷歌拥有所有可以推送Gemini的渠道,ChatGPT却要为每个新用户而战,这个威胁有多大?
萨姆·奥特曼:我认为谷歌仍然是一个巨大的威胁,他们是一家极其强大的公司。如果在2023年,谷歌真的决定认真对待我们,我们可能会处境非常糟糕。我认为他们本可以轻易击垮我们。但他们当时的AI产品方向不太对。他们自己也曾有过“红色警报”时刻,但并没有那么认真对待。
另外,谷歌可能拥有整个科技行业最伟大的商业模式。我认为他们不会轻易放弃。但我认为,把AI生硬地嵌入网络搜索,可能效果不如完全重新构想这件事。这实际上是一个我认为更有趣的宏观趋势:将AI生硬地嫁接到现有的做事方式上,效果不如在一个“AI优先”的世界里重新设计一切。这也是我们当初想做消费级设备的部分原因,但这个道理适用于许多其他层面。如果你把AI塞进一个即时通讯应用,让它帮你总结消息、起草回复,那确实会好一点。但我认为这不是终极形态。
终极愿景是,你拥有一个非常智能的AI,作为你的智能体,与其他人的智能体沟通,判断何时打扰你、何时不打擾,知道哪些决策它可以处理,何时需要询问你。搜索、生产力套件等领域也是如此。我怀疑这总比你想象的要花更长的时间,但我预感我们将会看到,在各大主流领域中出现完全围绕AI构建的全新产品,而不是生硬地嵌入AI。我认为这是谷歌的一个弱点,尽管他们拥有巨大的分发优势。
主持人:我和很多人讨论过这个问题。当ChatGPT刚推出时,我记得好像是本尼迪克特·埃文斯 (Benedict Evans) 说过,你可能不想把AI放进Excel,你可能想重新构想如何使用Excel。在我脑海里,那就像是上传你的数据,然后和你的数据对话。但人们在开发这些东西时发现,背后需要某种后端支持。所以,是不是说你先构建后端,然后用AI与之交互,就好像它是一个新的软件程序?
萨姆·奥特曼:对,事情差不多就是这样。
主持人:但那样的话,为什么不能直接把它嫁接在现有产品之上呢?
萨姆·奥特曼:嗯,你可以嫁接,但……我每天在各种即时通讯应用(包括邮件、短信、Slack等)中花费大量时间。我认为那根本就是个错误的界面。你可以把AI嫁接在上面,同样,它会好一点点,但我更希望的是,能够在早上说:这是我今天想完成的事情,这是我担心的,这是我思考的,这是我希望发生的。我不想整天都在和人发信息。我不需要你总结它们,不需要你给我看一堆草稿。处理掉你能处理的一切。你了解我,了解这些人,知道我想完成什么。然后,每隔几个小时,如果需要我做什么,再批量通知我。但这与这些应用目前的工作方式截然不同。
主持人:我正想问,ChatGPT在未来一年以及两年后会是什么样子。是朝这个方向发展吗?
萨姆·奥特曼:说实话,我原本以为到了现在这个时候,ChatGPT的样子会和刚推出时有更大的不同。
主持人:你当时预想的是什么样子?
萨姆·奥特曼:我不知道。我只是觉得那个聊天界面不会像实际发展得那么深远。我的意思是,它现在看起来更好了,但大体上和当初作为研究预览版发布时相似——那原本甚至没打算成为一个产品。我们知道文本界面很好,大家都习惯给朋友发短信,也喜欢那样。聊天界面很好,但我原本以为,要成为如今这样规模庞大、被广泛用于实际工作的产品,它的界面必须比现在进步得多。我仍然认为它应该那样发展,但我低估了当前界面通用性所具有的力量。
当然,我认为应该发生的是,AI应该能为不同类型的任务生成不同的界面。所以,如果你在讨论数据,它应该能以不同的方式展示给你,你也应该能以不同的方式与之互动。我们通过像Canvas这样的功能已经有了一点这方面的尝试。它应该更具交互性。现在基本上是一来一回的对话。如果你能一边谈论一个对象,它能一边持续更新,你有更多问题、更多想法、更多信息进来,那就更好了。
随着时间的推移,它应该更主动,也许它能理解你当天想完成什么,并在后台持续为你工作,向你发送更新。你可以从人们使用Codex的方式中看到这一点,我认为这是今年发生的最令人兴奋的事情之一——Codex变得非常出色。它指向了我所希望的未来形态。但令我惊讶的是,过去三年ChatGPT的变化如此之小。
主持人:是的,这个界面很有效。但我想它的内核已经变了。你提到了个性化很重要,对我来说,记忆力一直是个真正的关键差异点。我几周来一直在和ChatGPT讨论一个即将到来的、有很多规划环节的旅行。我可以在新窗口直接说:“好了,我们接着讨论这个旅行。”它拥有上下文,知道我要跟哪个向导,知道我在做什么。事实上,我一直在为此进行健身规划,它真的能综合所有这些事情。记忆力能达到多好?
萨姆·奥特曼:我认为我们无法想象,因为人类是有极限的。即使你有世界上最好的私人助理,他们也无法记住你说过的每一个字,无法读过你的每一封邮件,无法读过你写过的每一份文件,无法每天关注你所有的工作并记住每一个小细节。他们无法以那种程度参与你的生活。没有人拥有无限完美的记忆。
而AI肯定能做到这一点。我们确实经常讨论这个:现在的记忆仍然非常粗糙、非常早期,我们正处于记忆的“GPT-2时代”。但当它真的能记住你一生中的每一个细节,并根据这一切进行个性化——不仅仅是事实,还有你可能甚至没有想过要指明的细微偏好,但AI却能捕捉到——我认为那将非常强大。这仍然可能不是2026年就能实现的事情,但却是我最期待的功能之一。
主持人:我和一位神经科学家做过节目,他提到你无法在大脑中找到“思想”本身。大脑没有一个特定的地方来储存思想,但计算系统中有。所以,你可以保留所有的思想。随着这些机器人保存我们的思想,当然存在隐私问题。但另一件有趣的事是,我们将真的与它们建立关系。我认为这是整个AI时代最被低估的事情之一:人们已经感觉到这些机器人是他们的同伴,在关心他们。我很好奇你的看法。当你想到人们与这些机器人的亲密程度,或者说陪伴关系,是否存在一个可以调节的“旋钮”,比如“让我们确保人们与这些东西变得非常亲近”,或者我们把它调得远一点,保持一定的距离?如果有这个“旋钮”,你如何以正确的方式调节它?
萨姆·奥特曼:确实有比我想象中更多的人希望拥有一种我们可以称之为“亲密陪伴”的关系。我不知道用什么词合适。“关系”感觉不太对,“陪伴”也不太对。我不知道该怎么称呼,但他们希望与AI有这种深刻的连接。在当前的模型能力水平下,想要这种连接的人比我预期的要多。有很多原因导致我们低估了这一点。今年年初,说想要这个还被认为是非常奇怪的事。也许很多人现在仍然不承认,但他们的实际选择偏好显示,人们喜欢他们的AI聊天机器人了解他们、对他们热情、给予支持,这即使对那些嘴上说不关心的人来说也是有价值的。
我认为这其中存在一些非常健康的版本,我认为成年用户应该有很大选择权来决定他们希望处于哪个位置。肯定也存在一些在我看来不健康的版本,尽管我肯定很多人会选择那样做。然后还有一些人,他们肯定只想要最枯燥、最高效的工具。所以我怀疑,就像许多其他技术一样,我们将进行实验。我们会发现其中存在好的和坏的未知之数。社会将随着时间的推移,弄清楚如何思考人们应该将这个“旋钮”设置在何处,然后人们会有巨大的选择权,并将其设置在非常不同的位置。
主持人:所以你的想法是,基本上允许人们自己决定这一点。
萨姆·奥特曼:是的,绝对是。但我不认为我们知道它应该走多远,或者说我们应该允许它走多远。我们打算在这方面给予人们相当大的个人自由。有一些例子,我们讨论过,其他服务可能会提供,但我们不会。比如,我们不会让我们的AI试图说服人们应该与它建立排他性的浪漫关系。我们会保持开放。但我确信其他服务会这样做。因为粘性越强,那个服务赚的钱就越多。所有这些可能性,稍微深入想想,都有点可怕。
主持人:完全正确。这个话题确实是……我个人认为,你能看到这件事可能走向非常糟糕的方向。你提到了企业级,我们来谈谈。你上周在纽约和一些新闻公司的编辑和CEO共进午餐,告诉他们企业级将是OpenAI明年的一个主要优先事项。我很想多听听为什么这是优先事项,你如何评估与Anthropic的竞争。我知道人们会说这对一直专注于消费级的OpenAI来说是一个战略转向。给我们概述一下企业级计划吧。
萨姆·奥特曼:我们的战略始终是“消费级优先”。这有几个原因:一是,此前的模型不够稳健和强大,不适合大多数企业用途,但现在它们正在达到那个水平。二是我们当时在消费级市场有一个清晰的获胜机会,这种机会很罕见,来之不易。我认为如果你在消费级市场获胜,会极大地有助于在企业级市场获胜,我们现在正看到这一点。但正如我之前提到的,今年是我们企业级增长超过消费级增长的一年。考虑到模型目前的状态以及明年将达到的水平,我们认为现在是我们可以迅速建立一个真正重要的企业级业务的时机。我的意思是,我们已经有了一项企业业务,但它可以增长得更多。
公司似乎已经准备好了,技术似乎也准备好了。编程是迄今为止最大的应用范例,但现在其他垂直领域也增长非常快。我们开始听到企业说:“我真的只想要一个AI平台。”
主持人:哪个垂直领域?
萨姆·奥特曼:科学、金融是我个人对目前所有进展中最兴奋的领域。客户支持也做得很好。但是,我们有一个叫做GDP-val的评估标准。
主持人:我正要问你那个。我可以直接问那个问题吗?因为我写信给Box的CEO亚伦·利维 (Aaron Levy),我说我要见萨姆,应该问他什么?他说问一个关于GDP-val的问题。所以这是衡量AI在知识工作任务中表现的指标。我回到你们最近发布的GPT-5.2的发布信息,看了GDP-val图表。这当然是OpenAI的内部评估。图表显示,GPT-5 Thinking模型在38.8% 的任务中与知识工作者打平或击败了他们。而GPT-5.2 Thinking模型在70.9% 的知识工作任务中打平或获胜,GPT-5.2 Pro则是74.1%。它超过了专家水平的门槛,处理了大约60% 的专家级任务,使其在知识工作上与专家平起平坐。这些模型能做这么多知识工作,意味着什么?
萨姆·奥特曼:你问的是垂直领域,这是个很好的问题。我刚才有点犹豫是因为,那个评估涉及企业必须做的40多个不同的垂直领域:制作PPT、做法律分析、编写小型Web应用等等。该评估的标准是,对于企业必须做的许多事情,专家是否更偏爱模型的输出,而不是其他专家的输出。
这些都是范围明确的小型任务,不包括那些复杂的、开放式的创造性工作,比如构思新产品,也不包括很多团队协作的事情。但如果你能分配给一个AI同事一个小时的任务,并且74%或70% 的时间里拿回你更满意的结果,这还是相当了不起的。如果你回到三年前ChatGPT刚推出的时候说,我们三年后会达到这个水平,大多数人会说“绝对不可能”。所以,当我们思考企业将如何整合这项技术时,它不再仅仅是能写代码,而是所有这些你可以外包给AI的知识工作任务。企业要弄清楚如何与之整合需要一段时间,但这应该是相当可观的。
主持人:我知道你不是经济学家,所以我不打算问你这对就业有什么宏观影响,但我只想给你读一段我听到的关于它如何影响就业的话。这是来自Substack上的《机器中的血液》(Blood in the Machine)。一位技术文案说:“聊天机器人来了,让我的工作变成了管理机器人,而不是管理一个客服团队。”这在我看来似乎会经常发生。但这个人接着说:“一旦机器人接受了足够的训练,能够提供足够好的支持,那么我就被裁掉了。”这种情况会变得更常见吗?这是糟糕的公司会做的事吗?因为如果有人能协调一堆不同的机器人,你可能想留住他们。我不知道,你怎么看这个问题?
萨姆·奥特曼:我同意你的观点,很明显每个人都将管理大量的AI来做不同的事情。最终,就像任何优秀的管理者一样,你希望你的团队越来越好,而你只是承担更多的范围和责任。我不是一个“就业末日论者”。短期内我有些担忧,我认为转型在某些情况下可能会很艰难。但我们天生就非常在乎他人以及他人所做的事情。我们似乎非常注重相对地位,总是想要更多,想要发挥用处、提供服务、表达创造精神等等。我认为这些驱动我们走到今天的动力不会消失。
我确实认为未来的工作——或者我甚至不知道“工作”这个词是否合适——无论我们2050年整天做什么,看起来都可能与今天大不相同。但我并不认为生活会变得毫无意义,或者经济会彻底崩溃。我希望我们会找到更多的意义,经济也会发生重大变化,但我认为你不能与进化生物学对赌。我经常思考如何自动化OpenAI的所有职能,甚至更进一步,思考让AI来当OpenAI的CEO意味着什么。这并不会让我困扰,我对此感到兴奋,不会抗拒它。我不想成为那个死守着旧模式,说“我能用手工方式做得更好”的人。
主持人:一个AI CEO会做出一系列决定,将我们所有资源导向给AI更多能量和权力。你会设置护栏吗?
萨姆·奥特曼:显然,你不希望出现一个不受人类治理的AI CEO。但如果你想想……也许这个类比有点疯狂,但我就这么说吧:如果想象一个版本,世界上每个人实际上都是一家AI公司的董事会成员,可以告诉AI CEO该做什么,如果它做得不好可以解雇它,并对决策进行治理,但AI CEO可以尝试执行董事会的意愿。我认为对未来的人来说,这似乎是一件相当合理的事情。
主持人:好的,我们接下来要谈基础设施,但在离开关于模型和能力的这一部分之前,GPT-6什么时候来?
萨姆·奥特曼:我不知道我们什么时候会称一个模型为GPT-6。但我预计在明年第一季度会有比5.2有显著进步的新模型。
主持人:“显著进步”是什么意思?
萨姆·奥特曼:我还没有具体的评估分数给你,但在企业方面和消费级方面都会有很大改进。目前消费者最想要的不再是更高的智商,但企业仍然想要更高的智商。所以我们会针对不同用途,以不同方式改进模型。但我们的目标是打造一个让每个人都更喜欢的模型。
主持人:基础设施方面,你有大约1.4万亿美元的承诺用于建设基础设施。我听过很多你关于基础设施的言论。你说过:“如果人们知道我们能用算力做什么,他们会想要多得多的算力。”你还说:“我们今天能提供的与10倍、100倍算力之间的差距是巨大的。”你能稍微展开说一下吗?你们打算用这么多算力做什么?
萨姆·奥特曼:我早些时候稍微提到了一点。我个人最兴奋的是利用AI和大量算力来发现新科学。我相信科学发现是让世界为每个人变得更好的根本。如果我们能把巨大的算力投入到科学问题上,发现新知识——现在已经有了一点点苗头,还非常早期,都是一些很小的事情,但我在这个领域的历史中学到的是,一旦曲线开始微微上扬,我们就知道如何让它变得越来越好。但这需要巨大的算力。所以这是一个我们正在投入大量AI的领域,用于发现新科学、治愈疾病等很多事情。
最近一个很酷的例子是,我们用Codex构建了Sora的安卓应用,他们大概花了一个月时间。他们使用了海量的token。在OpenAI工作的一个好处是,使用Codex没有任何限制。他们用了海量的token,但完成了通常需要很多人、更长时间才能完成的工作,Codex基本上为我们完成了。你可以想象这可以走得更远,整个公司都可以使用大量算力来构建他们的产品。
人们谈论了很多关于视频模型将如何催生实时生成的用户界面。那将需要大量算力。希望转型业务的企业会使用大量算力。希望提供良好个性化医疗服务的医生,能够持续测量每位患者的各项体征,你可以想象那会使用大量算力。很难描述我们已经使用了多少算力来生成世界上的AI输出。这些是非常粗略的数字,这样说可能不太严谨,但我发现这种思维实验有点用,请原谅我的不严谨。
假设今天一家AI公司可能每天从前沿模型生成大约10万亿个token。世界上有80亿人,假设平均每人每天输出的token数量是2万。然后你可以开始比较。你可以说:“嗯,这家公司每天输出的token将超过全人类的总和,然后是10倍,然后是100倍。”从某种意义上说,这是一个非常愚蠢的比较,但从某种意义上说,它给出了一个数量级概念:地球上多少智力“运算”是由人脑完成的,多少是由AI大脑完成的。这两者的相对增长率很有趣。
主持人:你是否确定有这种需求来使用这些算力?比如,如果OpenAI投入双倍的算力到科学上,我们是否确定会有科学突破?或者在医疗上,我们是否确定有能力帮助医生?有多少是基于你对今天所见的明确理解,有多少是对未来可能发生的事情的推测?
萨姆·奥特曼:基于我们今天所见的一切,这些事情都会发生。但这并不意味着未来不会发生一些疯狂的事情。有人可能发现一个全新的架构,带来1万倍的效率提升,那样我们可能真的会过度建设一段时间。但我们现在看到的关于模型在每个新水平上进步的速度,以及每次我们降低成本时人们更想使用它们的情况,一切迹象都表明,需求将会增长,人们会用它来做精彩的事情,也做傻事。这看起来就是未来的形态。
这不仅仅是每天能处理多少token。随着这些编程模型变得更好,它们可以思考很长时间,但你不想等那么久。所以还会有其他维度,不仅仅是token的数量。但对智能的需求,以及我们能用这些智能做什么……如果你有一个非常困难的医疗问题,你是想用GPT-5.2还是GPT-5.2 Pro,即使后者需要多得多的token?我想你会选择更好的模型。
主持人:我们稍微深入一层。关于科学发现,你能举个例子吗?比如一个科学家今天有问题X,如果我投入算力Y就能解决,但目前无法做到。
萨姆·奥特曼:今天早上推特上有个事,一群数学家都在互相回复推文。他们说:“我原本对语言模型能做好事情非常怀疑。GPT-5.2是让我改变看法的那个。”它在一些帮助下完成了一个小证明,发现了一个小东西,但这确实改变了我的工作流程。然后其他人也加入说:“我也是。”有人说GPT-5.1就已经达到了,但不多。这是一个非常近期的例子,这个模型才发布5天左右,数学研究界似乎认为发生了重要的事情。我看到格雷格·布罗克曼 (Greg Brockman) 一直在他的推送中强调各种数学和科学用途。我认为在这些社区中,GPT-5.2确实取得了突破。所以,随着事情进展,看看会发生什么会很有趣。
在这种规模下,算力的难点在于你必须提前很久进行规划。你提到的那1.4万亿美元,我们会在很长一段时间内花费。我希望我们能更快。我认为如果我们能更快,会有需求。但建设这些项目、运行数据中心的能源、芯片、系统和网络等一切都需要极其漫长的时间。所以这会持续一段时间。但从去年到现在,我们的算力大概增加了两倍。明年我们将再增加两倍,希望之后还能再增加。收入增长速度比这还要快一点,但大致与我们的算力规模同步。我们从未遇到过无法将我们拥有的所有算力很好地货币化的情况。我想如果我们现在的算力翻倍,收入也会翻倍。
主持人:我们来谈谈数字,既然你提到了。收入在增长,算力支出也在增长,但算力支出的增长速度仍然超过收入增长。报道的数字是,OpenAI从现在到2028、2029年之间将亏损大约1200亿美元,然后才会开始盈利。那么,这如何改变?转折点在哪里?
萨姆·奥特曼:随着收入增长,以及推理在算力集群中占的比例越来越大,最终它会超过训练支出。这就是计划。花很多钱训练,但赚得越来越多。如果我们不如此大幅度地持续增加训练成本,我们本可以更早实现盈利。但我们下的赌注是,非常积极地投资训练这些大模型。
主持人:整个世界都在想你的收入如何与支出匹配。问题是,如果今年的收入目标是200亿美元,而支出承诺是1.4万亿美元……
萨姆·奥特曼:那是在很长一段时间内。是的。所以我想提这个。我认为如果能一次性向大家说清楚这些数字将如何运作,那就太好了。这非常困难。我发现自己做不到,我见过的也很少有人能做到。你知道,你可以对很多数学问题有很好的直觉,但人们通常很难在脑海中快速构建一个关于指数增长的良好心智模型。
出于某种原因,进化需要我们擅长用大脑做很多数学运算,但模拟指数增长似乎不是其中之一。我们相信我们可以在相当长的一段时间内保持非常陡峭的收入增长曲线。我们现在看到的一切都继续表明,如果我们没有算力,我们就无法做到。我们太受算力限制了,这对收入线影响如此之大,以至于我认为如果我们到了有很多闲置算力、无法在每单位算力基础上盈利的地步,有人问“这一切将如何运作”是非常合理的。但我们已经从多个角度推演过这笔账。当然,我们也会在每美元浮点运算数方面变得更高效,因为我们一直在努力降低算力成本。但我们看到消费级增长,看到企业级增长。
还有一大堆我们甚至尚未推出但将会推出的新业务。但算力确实是实现这一切的生命线。所以,我们沿途会有检查点,如果我们在时间或数学上有点偏差,我们有一些灵活性,但我们一直处于算力赤字状态。算力一直限制着我们能做的事情。不幸的是,我认为情况将一直如此,但我希望随着时间的推移情况能有所改善。因为我认为我们可以提供很多伟大的产品和服务,这将是一笔伟大的生意。
主持人:所以,实际上训练成本占总体的百分比会下降,但总金额会增加。然后你的预期是,通过像这次企业级推动、人们愿意为ChatGPT付费、通过API等,OpenAI将能够通过收入来支付这些成本。
萨姆·奥特曼:这就是计划。我认为最近市场对此有点失去理智。我觉得让市场感到不安的是债务进入了这个等式。关于债务的传统观念是,当有可预测的事情时,你才会借贷。公司会借贷,进行建设,并获得可预测的收入。但这是一个新类别,它是不可预测的。你怎么看待债务进入这个领域的事实?
主持人:首先,我认为市场更早之前就有点失去理智了。今年早些时候,我们和某家公司会面,第二天那家公司的股价就会上涨20%或15%。那太疯狂了,感觉很不健康。实际上,我很高兴市场上现在有更多的怀疑和理性,因为在我看来,我们正朝着一个非常不稳定的泡沫前进,现在我认为人们有了一定程度的纪律性。所以,实际上我认为是人们之前疯了,现在更理性了。在债务方面,我认为……如果我们建设基础设施,行业中的某人会从中获得价值。现在仍然非常早期。但我认为没有人会质疑AI基础设施将不会产生价值。因此,我认为债务进入这个市场是合理的。我认为也会有其他类型的金融工具。我怀疑我们会看到一些不合理的工具,因为人们会真正创新融资方式。但是,借钱给公司建设数据中心,这对我来说似乎没问题。
主持人:人们的担忧是,如果事情不以现有速度继续发展,比如模型进步停滞,那么基础设施的价值就会低于预期价值。然后,是的,那些数据中心对某些人来说仍然有价值,但可能会被清算,有人会以折扣价买下它们。
萨姆·奥特曼:我确实怀疑,这过程中会有一些繁荣和萧条的循环。这些事情从来都不是一条完美的直线。首先,对我来说非常清楚的是(我乐意用公司来打赌),模型将会变得好得多得多。我们对这一点有相当好的把握,非常有信心。即使模型不进步,我认为世界也有很大的惯性。适应事物需要时间。我相信GPT-5.2所代表的经济价值,相对于世界目前已经知道如何从中获取的价值,其“能力过剩”是如此巨大,即使你将模型冻结在GPT-5.2,你还能创造多少价值,从而驱动多少收入?我敢说非常多。
实际上,你没问这个,但如果我能稍微跑题一下。我们过去经常谈论一个2x2矩阵:短期时间线/长期时间线,缓慢起飞/快速起飞。我们认为在不同时间概率会发生变化,你可以根据你在这个矩阵中的位置来理解世界应该优化的许多决策和策略。在我的脑海中,现在出现了一个Z轴,那就是“小过剩”和“大过剩”。我猜我之前没怎么仔细想过这个,但我的反思是,我一定是假设过剩不会那么大,如果模型有很多价值,世界会很快想办法部署它。但现在在我看来,过剩在世界上大多数地方都会非常巨大。
你会有些领域,比如一部分程序员,通过采用这些工具,生产力会大大提高。但总体来说,你有这个聪明得惊人的模型,坦白说,大多数人仍然在问GPT-4时代问过的类似问题。科学家不同,程序员不同,也许知识工作会不同,但存在巨大的能力过剩。这对世界产生了一系列非常奇怪的后果,我们还没有完全理解这将如何展现,但这与几年前的预期大相径庭。
主持人:关于这种“能力过剩”,我有个问题。基本上,模型能做的比它们目前做的多得多。我试图理解模型怎么能比它们被使用的程度好那么多,但很多企业在尝试应用它们时,并没有获得投资回报。至少麻省理工学院 (MIT) 的调查是这么显示的。
萨姆·奥特曼:我不太确定该怎么想,因为我们听到所有这些企业说:“如果你把GPT-5.2的价格提高10倍,我们仍然会付钱。你们定价太低了,我们从中获得了这么多价值。”所以,这对我来说似乎不太对劲。当然,如果你问程序员,他们会说:“我愿意付100倍的价格。”这只是官僚主义把事情搞砸了吗?
假设你相信GDP-val的数字——也许你有理由不信,也许它们是错的——但假设它是真的,对于这些范围明确、不算超长的知识工作任务,十次中有七次你会对GPT-5.2的输出同样满意或更满意。那么你应该大量使用它。然而,人们改变工作流程需要很长时间。人们太习惯于让初级分析师做PPT之类的,这比我想象的更顽固。你知道,我仍然以非常相似的方式运行我的工作流程,尽管我知道我可以更多地使用AI。
主持人:好的,我们还剩10分钟。哇,真快。我有四个问题。我们看看能不能闪电式完成它们。你们正在开发的设备…… 我听说,手机大小,没有屏幕。如果它是没有屏幕的手机,为什么它不能是一个应用程序?
萨姆·奥特曼:首先,我们将打造一系列小型设备,不会只有单一设备。随着时间的推移,我认为人们使用计算机的方式会发生转变,从一种“愚钝”、被动的东西,转变为一个非常智能、主动的东西,它能理解你的整个生活、你的上下文、你周围发生的一切,非常了解你周围的人——无论是物理上接近还是通过计算机与你合作的人。我认为当前的设备不适合那种世界。我非常相信,我们在设备的极限下工作。
你知道,你有一台计算机,它有一系列设计选择。它可以是开放的或封闭的,但它不能……比如,“注意听这个采访,但要保持封闭,如果我忘了问萨姆问题,就悄悄提醒我”之类的。也许那会有帮助。还有屏幕,这限制了你,就像几十年来图形用户界面的工作方式一样。还有键盘,它的设计是为了降低你输入信息的速度。这些长期以来都是未经质疑的假设,但它们有效。然后这个全新的东西出现了,它打开了一个可能性空间。但我不认为当前设备的形态是这种惊人新功能的最佳匹配。如果是,那反而很奇怪。
主持人:天哪,我们可以就这个聊一个小时。我们继续下一个问题。云计算。你谈过要建设云计算。我们收到一位听众的电子邮件:“在我的公司,我们正在从Azure迁移,并直接与OpenAI集成,为我们产品中的AI体验提供动力。重点是注入数万亿token流,通过技术栈为AI体验提供动力。” 计划是以这种方式建立一个庞大的云业务吗?
萨姆·奥特曼:首先,数万亿token,是很多token。关于算力需求和我们的企业战略,企业已经明确告诉我们他们想从我们这里购买多少token。我们在2026年将再次无法满足需求。但战略是:大多数公司似乎希望来到像我们这样的公司,说:“我想要我们公司的AI。我需要一个为我们公司定制的API,需要为我们公司定制的ChatGPT企业版,需要一个可以运行所有这些我能信任的智能体的平台,需要将数万亿token注入我的产品的能力,需要让我所有内部流程更高效的能力。”我们目前还没有一个很好的、一体化的产品提供给他们,我们想打造这个。
主持人:你的抱负是把它做到与亚马逊AWS和微软Azure这些公司同等水平吗?
萨姆·奥特曼:我认为这与它们是不同类型的东西。我并没有抱负去提供所有托管网站之类的服务。但我认为……是的,我猜人们会继续拥有他们的“网络云”,然后我认为会有另一个东西,公司会说:“我需要一个AI平台来处理我想做的一切,无论是内部还是我想提供的服务。”它在某种意义上存在于物理硬件上,但我认为这将是一个相当不同的产品。
主持人:我们快速谈谈科学发现。你说过一些非常有趣的话,你认为模型或人们与模型合作,明年会做出小发现,五年内会做出大发现。是模型本身吗?还是人们与它们合作?什么让你确信这会实现?
萨姆·奥特曼:是人们在模型的帮助下。模型能自己提出问题的感觉还很遥远。但如果世界从新知识中受益,我们应该非常高兴。我认为人类进步的整个过程就是,我们建造这些更好的工具,然后人们用它们做更多事情,在这个过程中又建造更多工具,我们就这样一层一层、一代一代、一个发现接一个发现地向上攀登。我认为是人类在提出问题这一点,丝毫不会削弱工具的价值。
我认为这很棒。今年年初,我以为小发现会在2026年开始,但它们在2025年底就开始了。重申,这些都非常小,我真的不想夸大,但任何发现和什么都没有,我感觉有质的区别。当然,三年前我们推出那个模型时,它不会对人类知识总量做出任何新贡献。
从现在到五年后,实现重大发现的旅程,我怀疑就像AI通常的爬坡过程,每个季度都好一点点,然后突然之间,我们就会惊叹:“哇,人类在这些模型的增强下,正在做五年前的人类绝对做不到的事情。”而我们是否主要将此归功于更聪明的人类还是更聪明的模型,只要我们获得科学发现,无论哪种方式我都非常高兴。
主持人:明年IPO吗?我不知道。你想成为一家上市公司吗?你看起来可以长期保持私有。你会在需要资金之前上市吗?
萨姆·奥特曼:这里涉及很多事情。我确实认为公共市场能够参与价值创造是很酷的。从某种意义上说,如果我们看任何以前的公司,我们上市会非常晚。作为一家私营公司很棒。我们需要大量资本。我们最终会突破股东数量限制之类的门槛。那么,我对成为一家上市公司的CEO感到兴奋吗?0%。我对OpenAI成为一家上市公司感到兴奋吗?在某些方面是的,在某些方面,我觉得这会很烦人。
主持人:我很仔细地听了你与西奥·冯 (Theo Von) 的访谈,非常棒的访谈。他真的很懂行,做了功课。你告诉他,就在GPT-5发布前夕,“GPT-5在几乎所有方面都比我们更聪明。”我以为那就是通用人工智能 (AGI) 的定义。这不就是AGI吗?如果不是,这个术语是不是已经变得有些没有意义了?
萨姆·奥特曼:这些模型在原始智力上显然非常聪明。过去几天,关于GPT-5.2的智商是147、144还是151的讨论很多,取决于谁做的测试,反正是一个很高的数字。有很多领域专家说它能做这些惊人的事情,能提高他们的效率。我们也讨论了GDP-val。
但有一件事它做不到:它今天不能做某件事,意识到自己不会,然后自己去想办法学会、理解它,第二天你回来时它就能做对了。这种持续学习的能力,小孩子都能做到。这在我看来像是我们需要构建的一个重要部分。那么,没有这个能力,能有大多数人认为是AGI的东西吗?我猜答案很明确。我的意思是,很多人会说我们现在的模型已经达到了AGI。我想几乎所有人都会同意,如果我们拥有当前的智力水平再加上那个能力,那显然就非常接近AGI了。但也许大多数人会说:“好吧,即使没有那个,它也能完成大多数重要的知识性任务。在大多数方面比我们大多数人都聪明。我们已经达到AGI了。它正在发现一小块新科学。我们达到AGI了。” 我想这意味着,尽管我们很难停止使用这个术语,但它确实定义非常模糊。
我有个想法。关于AGI我们搞错的一件事就是我们从未定义它。现在大家关注的新术语是我们何时达到超级智能 (super intelligence)。所以我的提议是,我们同意AGI这个概念已经“嗖”地一下过去了,它并没有怎么改变世界,或者长远看它会,但好吧,我们在某个时刻已经构建了AGI,现在我们处于一个模糊期,有些人认为我们已经有了,有些人认为还没有,以后会有更多人认为我们有了,然后我们会说:“好吧,下一步是什么?”
关于超级智能,一个候选定义是:当一个系统能够比任何人类(即使有人工智能辅助)更好地胜任美国总统、大公司CEO、运营大型科学实验室等工作时。我认为国际象棋领域发生的事很有趣,我记得非常清楚,就是“深蓝” (Deep Blue) 那个事,有一段时间是人类和AI合作比单独的AI更强,但后来人类反而拖了后腿,最聪明的是不受人类干扰的、没有人类“不理解其伟大智慧”的AI。类似这样的框架对于定义超级智能很有趣。我认为这还很遥远,但我希望这次能有一个更清晰的定义。
主持人:萨姆,我已经使用你们的产品三年了,每天都在用。它们确实变得更好了,甚至无法想象它们下一步会走向何方。
萨姆·奥特曼:我们会努力让它们变得更好、更快。
主持人:这是我们第二次交谈,我感谢你两次都如此坦诚。谢谢你的时间。



































