【对谈】Sam Altman 向我展示了GPT-5...以及接下来的发展
发布于: 2025年8月17日
本期视频是由 Cleo Abram 采访 OpenAI CEO Sam Altman,围绕最新发布的 GPT-5、人工智能的未来、超级智能(Superintelligence)的定义与路径、可能带来的社会变革与风险等展开的长谈。
Sam 分享了 GPT-5 相较于 GPT-4 的重大提升,比如在复杂任务中的表现、即时软件生成能力、更自然的写作质量,以及在医疗健康领域的显著进步。他探讨了 AI 在科学发现、自我进化能力、与人类社会共同演化的进程,以及伴随技术发展带来的伦理、就业、社会契约与文化冲击。
同时,Sam 对未来的五到十年做出推测,包括 AI 在医疗、创作、教育、就业模式上的深远变化,并强调使用这些工具、学会与之配合的重要性。整段访谈既有对技术走向的兴奋展望,也有对风险与责任的诚恳思考。
"最幸运的是今天22岁的年轻人,他们手握史上最强大的创造工具。" —— Sam Altman
这是一项技术所拥有的惊人力量。而且这一切发生得如此之快。你们刚刚发布了GPT-5。今天出生的孩子将永远不会比AI更聪明。
我们如何分辨什么是真实的,什么是虚假的?我们还没有在ChatGPT中加入性机器人化身。超级智能,这究竟意味着什么?这东西太了不起了。
我即将采访OpenAI的CEO Sam Altman。OpenAI正在重塑各个行业。
说实话,他就是一个科技领主。现在,他们正在努力构建一个在几乎所有领域都能远超人类的超级智能,而且他们刚刚发布了迄今为止最强大的模型。就在几年前,这听起来还像是科幻小说。
现在不是了。事实上,他们并不孤单。我们正处于我们见过的最高风险的全球竞赛之中。数千亿美元和难以置信的人力投入。
这是一个深刻的时刻。大多数人从未经历过这样的技术变革,而它正在你我身边发生。所以,在这一集中,我想与Sam Altman一起时光旅行,进入他试图构建的未来,看看它是什么样子,这样你我才能真正理解即将到来的事物。
引言
主持人: Sam,很高兴能和你坐下来聊聊。OpenAI 正在致力于构建一种超级智能——一种在几乎所有领域都能远远超越人类的人工智能。而你们刚刚发布了迄今最强大的模型 GPT-5。几年前,这听起来还像科幻小说,但现在已经成为现实。我们似乎正处于人类历史上赌注最高的技术竞赛之中——技术进步来势迅猛,影响深远。这一切对我们来说是一个意义重大的时刻。在今天的节目中,我希望能和你一起“穿越”到你所设想的未来场景中,看看人工智能可能将把我们带往何方,以便让我们提前理解即将到来的变化。感谢你抽出时间接受我的采访。
Sam Altman:非常感谢,能来这儿我也很兴奋,我们开始吧!
主持人: 在正式开始之前,我想先说明一下此次采访的侧重点。我不会问你关于公司估值、人才竞争或融资之类的问题——这些话题在别的地方已经有充分的讨论。我们节目的宗旨,是探讨如何利用科学和技术让未来变得更美好。通过展望那些更加美好的未来,我们相信人们能够得到启发,从而参与构建这些未来。所以今天,我想尽力和你一起“预见未来”,透视你正在努力创造的未来图景,看看它会是什么样子。希望通过这样的对话,让我们的观众更好地理解即将到来的世界,并积极参与其中。
Sam Altman:明白了,听起来很棒。
GPT-5 的跃迁
主持人: 我想从你最新的发布开始聊起。你最近表示过,“GPT-4 是我们今后使用过的最笨的模型”——这番话引起了不小的惊讶。要知道,GPT-4 已经能在 SAT、法律执照考试、研究生入学考试等测试中打败90%以上的考生;它还能通过编程考试、品酒师考试,甚至医生执照考试。而现在,你们推出了更新的 GPT-5。那么,GPT-5 相比 GPT-4,有哪些是 GPT-4 做不到的新本领呢?
Sam Altman:首先,我想说,很重要的一点是:即使 GPT-4 已经具备了你刚才列举的那些惊人的能力,它依然在很多人类擅长的事情上表现不佳。这件事本身就说明了标准化考试成绩并不能代表真正的智能全面性。举个例子,如果我们回到 GPT-4 刚发布的那一天,然后告诉当时的你 GPT-4 在那些测试中的表现,你可能会觉得:“哇,这将对许多工作产生巨大影响,一些负面影响也在所难免”。你或许还会预测出一些正面的影响,但直到现在有些也还没实现。也就是说,这些模型在擅长的领域表现惊人,但仍然无法涵盖我们希望人类去做的许多事情。我猜,同样的情况在 GPT-5 身上还会再次发生:人们会对它能做到的事情惊叹不已,但很快又会希望它能做更多。
当然,GPT-5 在许多方面真的非常出色。它会被人们用来做各种令人难以置信的事情。我认为它将彻底改变许多知识型工作的模式——无论是我们学习的方式,还是创造内容的方式。现在令人惊叹的一点是,你口袋里的这一个软件就能执行如此多原本需要不同专业人才花费三分钟、五分钟甚至一小时才能完成的任务。在人类历史上,从未有过某个单一工具可以具备如此广泛的能力,这是前所未有的。虽然我们身处其中,一步步逐渐适应,但如果让五年前、十年前的人听说会出现这样的工具,他们可能根本无法相信。所以总的来说,GPT-5 在很多方面都很了不起,同时在另一些方面仍有局限。但拥有这样一款在众多领域都堪称能手的软件,本身就是一件令人惊奇的事。
主持人: 是的,光是想一想我们已经见证的进步就令人难以置信。那么具体来说,如果不考虑那些夸大的新闻标题,你对 GPT-5 哪些新的能力最感到兴奋?另一方面,你似乎也在给大家“泼冷水”,提示我们 GPT-5 不会 做到某些事情——你认为人们不该对 GPT-5 抱有哪些过高的期待呢?
Sam Altman:坦白讲,我最兴奋的一点是:现在我终于可以向模型提出各种艰深的科学或技术问题,并且它能给出相当不错的答案了。让我给你分享一个有趣的例子吧。
我上初中的时候,大概是九年级吧,买过一台 TI-83 图形计算器。我花了好长时间在上面用简单的编程做了一个“贪吃蛇”(Snake)小游戏。这个游戏在我们学校的同学中还挺受欢迎。我记得给 TI-83 编程实在太难受了:要写代码、调试,整个过程非常漫长、痛苦。而最近,我心血来潮,用早期内部版本的 GPT-5 尝试让它制作一个 TI-83 风格的贪吃蛇游戏——看看它能不能做到。
结果 GPT-5 在大概七秒钟之内就完美地把这个游戏做出来了!接着我又想,“嗯,我11岁时会觉得这样做好还是不好呢?是少了一些亲自动手编程的乐趣,还是单纯很酷?”老实说,我也就犹豫了三秒钟吧,很快就抛开了这种纠结,转而兴奋地想:“嘿,我还挺怀念这个游戏的。我脑中突然冒出一个疯狂的新点子——干脆再加个特别的功能!”然后我把这个新需求告诉 GPT-5,它立刻就把功能加上,游戏实时更新了。接着我的创意源源不断冒出来:“现在我还想试试这个…嗯,再来这个…” ——整个过程我感觉自己仿佛又回到了 11 岁时沉迷编程的状态,只不过这一次我可以瞬间实现想法、尝试各种创意。
当时我本来担心,孩子们如果不用亲自“啃骨头”式地学习编程,可能会错过一些磨炼。但很快我就转变了想法——我现在真为他们感到高兴!因为有了这些新工具,人们创造事物的速度将大幅提升。只需动动念头就能把创意变成现实,这实在令人惊叹。可以说,让 GPT-5 几乎即时地生成软件、实现创意,将成为 GPT-5 时代的一个显著特征,这是 GPT-4 时代所不具备的能力。我认为这一点将定义 GPT-5 带来的飞跃。
主持人: 听你这么说,我想到一个比喻。在健身领域有个概念叫“肌肉张力持续时间”(time under tension)。举例来说,你可以三秒内完成深蹲100磅重量,或者用30秒完成同样重量——如果用30秒,肌肉显然会得到更多锻炼。同样地,对于创造过程来说,我们最引以为豪的作品,往往都伴随着大量的“高张力”认知投入。要取得真正出色的成果,我们常常需要坐在那里反复琢磨、经历痛苦的思考过程。
所以,我有点担心,现在有了这些 AI 工具,人们会不会把它们当作某种“逃避艰苦思考的捷径”呢?当然,你也可以说:“计算器出现后,我们不再手算繁琐运算,而是把精力放在更难的问题上,不也挺好吗?”——但这次似乎不太一样。你觉得使用 GPT-5 这样的工具,会对我们的创造力和思维方式产生什么不同?我们会因此失去些什么吗?
Sam Altman:这个问题很精彩。我认为确实存在两种截然不同的使用方式:有些人用 ChatGPT 来避免思考,而有些人则用它来比以往更加深入地_参与_思考。我希望我们能够把这个工具打造得鼓励更多人动脑、拓展思维。你也知道,社会本身就是一个充满竞争的环境。理论上,有了新工具,人们或许会选择更清闲;但实际上,人们往往会更加努力工作,社会对个人的期望反而会提高。所以,我猜想 AI 工具会像以往任何技术一样:有些人借助它们可以做到更多,而有些人则可能因此做更少。但至少,对于那些有意愿利用 ChatGPT 增强自身“高张力”思考的人来说,他们现在完全有能力这么做,而且确实有人在这么做。
老实说,我本人就从那些最积极、最投入的用户身上汲取了大量灵感。比如说,最活跃的前5% ChatGPT 用户,真的让我们大开眼界——他们利用 ChatGPT 学习新知识、完成工作、创造内容,产出之多、学习之深入,实在令人惊叹。看到这些,我更加相信,关键在于使用者选择如何利用这些工具。对于善于利用 ChatGPT 来拓展认知的人来说,这款工具几乎没有上限。
主持人: 说得太好了。我自己也是刚拿到 GPT-5 没几个小时,还在摸索如何与它交互。我感觉自己好不容易刚学会怎么用好 GPT-4,现在又得重新学习怎么用 GPT-5 了,哈哈。你已经使用 GPT-5 一段时间了。具体来说,在你看来,GPT-5 最有趣、最令人印象深刻的用例是什么?哪些任务让你觉得它的表现远超以前的模型?
Sam Altman:就我个人而言,让我印象最深刻的是 GPT-5 的编程能力。当然,它在很多其他方面也很厉害,比如写作能力也有了显著提升。但让我感触最深的是:GPT-5 可以为几乎任何需求编写软件,这意味着我们能够用前所未有的方式将想法付诸实现。以前理论上你可以让 GPT-4 做很多事,但在 GPT-5 这里,因为它编程能力特别强,感觉上它几乎什么都能做到。当然,物理世界里的事情它还是做不到,但只要是能在计算机上完成的复杂任务,GPT-5 基本都能胜任。软件本身就是一种极其强大的手段——通过软件我们可以驱动很多事情,真正让想法落地。所以,GPT-5 在编程上的飞跃对我而言是最引人注目的。
同时,正如我刚才提到的,GPT-5 在写作上的质量也有了大幅提升。过去大家常诟病 AI 写作有一种“AI 腔”,比如总爱用破折号、语气有点奇怪,让人读起来别扭。GPT-5 仍然喜欢用破折号(笑),很多用户甚至还挺喜欢这个特点。但总的来说,GPT-5 生成文本的自然流畅度比以前好太多。我们 OpenAI 内部很多同事一开始只是知道各项指标上 GPT-5 更优秀,却很难具体描述它到底哪里好。但当他们偶尔回过头去用 GPT-4 时,立刻就感觉明显“不对劲”了——这种说不清道不明的差异,很大程度上可能就是因为 GPT-5 写出来的内容读起来顺畅自然得多。
主持人: 这么说来,难怪大家都说 GPT-4 以后再也回不去了,哈哈。你刚才提到了 OpenAI 内部的看法,这让我想到:在准备这次采访时,我联系了一些科技和 AI 领域的领军人物,请他们提供一些问题。Stripe 的 CEO Patrick Collison 就贡献了一个好问题,我们来听听他的问题吧。他说,他想问:“你认为在哪一年,大型语言模型将会取得一项重大的原创科学发现?如果到现在还没发生,那缺少的要素是什么?”他特地补充说,不要把纯粹的数学突破或 AlphaFold 这类特殊模型算在内——他指的是像 GPT 这样的通用模型。对于这个问题,你怎么看?
Sam Altman:这个问题很有意思。我想大多数人都会同意,在未来两年内,AI 将取得重大科学发现——但这里“重大”的定义很重要。有人可能认为2025 年年初就会发生,有人可能觉得要到 2026 年底甚至 2027 年。但如果要下注的话,我敢说到 2027 年底,大多数人都会承认:由 AI 主导的一项重大原创发现已经出现了。至于说目前还缺少什么让我认为它还没发生,我的看法是——归根结底还是模型的“认知能力”不足。
有位研究员跟我分享了一个框架,我非常喜欢。他是这么比喻的:假设去年这个时候,我们的 AI 模型大概能解决高中数学竞赛题——那种顶尖数学家几秒到几分钟就能搞定的问题。而最近,我们的模型已经达到 IMO(国际数学奥林匹克竞赛)金牌选手的水准。要知道,IMO 题目是极其困难的,许多职业数学家可能连一道题都解不出,而我们的模型现在可以达到顶尖选手的分数。当然,目前还有人类选手得分比模型更高,但模型已经进入了最高水平的行列。IMO 一共6道题,考试时长9个小时——顶尖数学家平均每题要花一个半小时。也就是说,我们的模型从几秒解高中题,进步到了需要累计几个小时才能解出的高难度问题。下一步,如果要证明一条全新的重要数学定理,可能需要世界上最厉害的人投入上千小时。我们需要让 AI 模型从能解决几个小时难度的任务,提升到能应对上千小时难度的任务。从目前的发展轨迹来看,这是有希望实现的,但显然还需要我们继续大幅扩大模型规模、提高能力。
主持人: 你的意思是说,我们目前的 AI 擅长解决短程任务,比如一分钟内就能完成的事情已经比人类强了;但在那些需要持续投入几百上千小时的大型科研项目上,AI 还远远不如人类。这两者听上去是截然不同维度的智能,对吧?短程超人 vs. 长程规划者。我们未来需要攻克的正是后者。
Sam Altman:没错。目前来看,我们的 AI 在“长线任务”上还很薄弱,这确实是人类智能与 AI 系统之间很不一样的一点。不过我相信我们终究会攻克这一点,只是当下它仍是一个短板。
迈向超级智能
主持人: 我们刚才聊了 GPT-5 的现状,也展望了终极目标——也就是超级智能。现在我的问题是:从 GPT-5 到超级智能,我们“看不清的中间路段”究竟是什么样?换言之,我们如何从现在的状态一路走到超级智能?这里我正好有一个来自英伟达 CEO 黄仁勋 (Jensen Huang) 的问题。他把它写成了一段耐人寻味的话,我直接念给你听:“客观的是事实 (Fact is what is),主观的是意义 (Truth is what it means)。事实是客观的,真理因人而异,取决于不同的视角、文化、价值观和信念。AI 可以学习事实,但如何让 AI 理解对不同背景下的每个人来说‘真理’意味着什么?”他这问题的前提假设挺有意思,我就当作公理接受了(尽管我不一定完全同意),但我们直接基于这个前提出发吧。Sam,你怎么看待这个“事实 vs. 真理”的问题?AI 要如何处理不同文化、不同个人的主观差异呢?
Sam Altman:这是个非常引人深思的问题。老实说,AI 在适应不同文化背景和个人方面的能力之强,让我感到意外,我想很多人也都有同感。举个例子,今年早些时候我们在 ChatGPT 上线了一个增强的“长期记忆”功能。现在,当我和 ChatGPT 聊天时,真的感觉它逐渐了解了我的喜好、我的价值观、我的生活经历。它开始懂得哪些对我是重要的,哪些是我在意的事情。
我有个朋友是 ChatGPT 的超级深度用户——几乎把生活中的方方面面都输入了对话。他最近做了个有趣的实验:给他的 ChatGPT 分身做了一系列人格测试,让 ChatGPT 模拟成他本人来回答问题。结果 ChatGPT 的得分跟他本人的真实测试结果几乎一模一样,而且有些人格特质他从没直接跟 ChatGPT 提及过!还有我自己的例子:经过几年的对话,我的 ChatGPT 已经学到了很多关于我的文化背景、我的价值观、我的人生的内容。有时候我会用一个没有任何历史记录的新 ChatGPT 帐号来体验,那种“陌生”的感觉非常明显。总的来说,我们都对 AI 在学习个人偏好和适应不同文化上展现出的能力感到惊喜,甚至可以说是惊艳。
主持人: 真的很有意思。那么,你是否预见未来在不同地区,人们会使用带有不同“文化规范”和价值观的定制化 AI?也就是说,每个人、每个社区都能有属于自己的 AI 助手,它们遵循本地的文化语境?
Sam Altman:我认为基础模型大概率还是同一个模型,但会有不同的上下文和设定来让它们表现出不同的个性化倾向——无论是个人的,还是社区的。换句话说,大家用的可能都是同样强大的通用 AI,但每个人都会为它提供一些背景信息、规则或偏好,让它以他们想要的方式行事。
回到黄仁勋提出的“事实与真理”问题,我觉得我们可以利用这种个性化和上下文来解决。事实上,这正是我们接下来要展开的讨论主题。所以我想,这里正是时候来一场未来之旅了!
AI 与现实:真假难辨的未来
主持人: 好的,我们的第一站是 2030 年。这是个很严肃的话题,但我想用一个轻松的例子来引入。你有没有看过最近疯传的那段“兔子蹦蹦跳”视频?就是几只兔子在蹦床上跳来跳去的那个。
Sam Altman: 看过。
主持人: 给没看过的听众解释一下:视频看起来像是后院拍到的几只兔子在蹦床上玩耍,非常逗乐。它最近在网上疯传,甚至有人把它配上了音乐,还剪出了一个完整版,成了现象级爆款。然而事实是——这段视频完全是 AI 生成的。这是许多人第一次在不知道真相的情况下欣赏了一个 AI 捏造的视频,然后才恍然大悟。人们发现“哇,原来我们喜欢的这个东西是假的”,于是引发了热议。
现在请你想象这样一个场景:到了 2030 年,我们还是青少年,我们刷着 2030 年版的社交媒体。满屏幕的视频和内容里,有真的也有假的。那么,作为生活在那个时代的人,我们要如何分辨什么是真,什么是假?
Sam Altman:这是一个非常重要的问题。要辨别真实与否,我们当然可以采取一些技术手段,比如给内容加上加密签名,只信任那些有可信签名的视频等等。但老实说,我感觉事情的走向可能是:现实和虚拟会逐渐融合得越来越难分彼此。其实现在就已经开始了——就拿你用手机拍的照片来说吧:看似是真实照片,但其实已经经过了一些 AI 算法的优化和处理。手机里有很多你不了解的算法在运作,把照片润色得更好看。有时你甚至会发现一些离谱的现象,比如手机拍到的月亮比肉眼看到的更清晰,这就是算法在背后做了手脚。
总之,我们已经默默接受了影像从完全真实逐渐过渡到“优化过的真实”。就像现在刷 TikTok,很多视频都经过了各种编辑和滤镜处理,让它“比真更真”。有些甚至整个场景都是 AI 生成的,或者部分内容由 AI 合成。我们也看科幻电影,那完全是虚构的,但我们明知它是假的也乐在其中。再比如,你在社交媒体上看到某人度假发的一张美照,其实照片是真的,但背后可能有几十个人在排队等着拍同样的照片——这个真相通常被有意无意地隐藏了。即使在没有 AI 的年代,媒体本身就一直是真假掺半的。
或许到了 2030 年,人们对“真实”概念的阈值会继续变化。究竟什么程度才算“够真实”,这个标准会不断移动。可以想象,更大比例的媒体内容会是人造的或经过大量润色的,但我们可能逐渐习以为常——觉得只要达到某个“真实度”我们就接受。当然,从现在到那时候,这个过渡肯定会引发不少阵痛,需要教育和适应。但回顾历史,每次新媒体出现都会有这样的过程:产生一团乱象,然后我们建立规则、学习分辨、继续前行。
也许到了那个时候,媒体内容有更高比例将不是字面上的“真实”。可另一方面,这也一直是一个长期趋势罢了——媒体技术发展,让我们塑造和美化现实的能力越来越强。所以我的看法是:虽然未来虚实难辨的情况肯定比今天更严重,但我们最终会像适应过去那些变化一样去适应它。
主持人: 总而言之,这将是一个社会教育和认知升级的过程。我们需要学会在信息茧房中保持警惕,锻炼辨别能力,对媒体的真实性持保留态度——就像我们已经在社交媒体时代开始做的那样。
Sam Altman:没错。我认为“媒体素养”将变得比以往任何时候都更重要。人们需要理解内容的来源和制作过程,提高鉴别真伪的技能。同时,也需要新技术手段帮助验证内容真实性,比如我提到的加密签名等等。总之,我们会经历一段“眩晕”的时期,感觉世界变得虚虚实实,让人眼花缭乱。但最终,人类适应变化的能力是惊人的——无论变化有多剧烈,我们总能找到新的平衡。
AI 与工作
主持人: 好,我们再向前“穿越”五年。这次来到 2035 年。假设现在是2035年,你和我正准备大学毕业。然而,有一些 AI 领域的领军人物曾大胆预言:五年之内,入门级的白领岗位会有一半被 AI 取代。如果那样的话,我们 2035 届的毕业生将面对一个与你我当初就业时完全不同的世界。你希望到时候世界是什么样子的?你觉得我们的工作和职业将发生怎样的变化?
大家总在讨论 AI 可能造成的工作流失,我也理解这种担忧。但我也想指出:像我现在所从事的这一职业,在十多年前可能根本没人能想到会存在。所以,除了“AI 抢走工作”这方面,你觉得AI 会创造出哪些全新的工作或机会?2035 年的新生代有可能从事哪些我们今天还无法想象的职业?
Sam Altman:这是个平衡得很好的问题。我先说结论:如果我是现在 22 岁刚毕业的大学生,我会觉得自己是史上最幸运的一代。真的,我是发自内心这么认为的。从未有哪个时代像现在这样,给年轻人提供如此广阔的空间去创造全新的事物、去发明创新、去创办公司(几乎任何一个人都可能凭一己之力建立一家独角兽企业)。更重要的是,你能够利用这些工具为全世界提供极其优秀的产品或服务。这听上去疯狂,但我相信现在一个人就可能创造价值十亿美元的公司,因为你掌握的工具可以让一个人完成过去需要数百人才能完成的工作。关键只是学会使用这些工具,然后发挥你的创意。有了 AI,每个人都仿佛身后有一支由上百名“数字员工”组成的团队——你的想法只要够好,就能迅速变成现实。
当然,这并不是说工作转型会毫无阵痛。确实会有一些职业完全消失,这一点在历史上已经一再发生。年轻人适应新环境的能力通常最强,但那些年龄更大、不想重新培训或转换跑道的人,可能会受到冲击。这是我们需要特别关注的群体。
不过,从社会整体来看,我对前景是乐观的。回到你说的正面方面:AI 将创造出大量我们以前无法想象的新职业和新行业。就像十年前没人会想到“AI 提示工程师”这种工作,但今天它已经出现了。未来五年、十年还会有更多类似的例子。一些旧职业会消失,更多职业会被改造或新生。拿你我来说,我们现在的工作在过去都不存在。社会已经证明了对这种变化的韧性:我们经历过技术革命带来的阵痛,最终还是找到了新的平衡。
坦率地说,我们现在无法完全预知 AI 带来的变革会有多迅猛、走多远。因此,我们需要保持一种谦逊和开放的态度,来审视我们现有的社会契约。也许有些我们过去觉得“想都别想”的政策或方案,现在需要认真考虑了。举个例子,如果 AI 真的在极短时间内大幅改变经济结构,我们是不是应该讨论例如全民基本收入之类的全新社会保障方案?过去这些主张很超前,但将来也许未必。总之,面对前所未有的变局,我们可能也需要前所未有的对策。
打造超级智能:算力、数据与算法
主持人: 我想聊聊更具体的技术推进问题。当前大家普遍认为,打造更强大的 AI 有三个关键要素:算力、数据和算法。你能不能谈谈 OpenAI 在这三方面是怎么考虑的?如果我们的观众未来看到一些相关的新闻头条,你能帮他们解读一下背后的意义吗?
Sam Altman:当然。我甚至想加上第四个因素:如何把技术变成用户手中的产品。科学研究本身固然重要,但如果不投入实际应用、与社会协同进化,它的效用是有限的。不过我们先按你说的顺序来。
首先是算力。老实说,支撑 GPT-5 背后的计算基础设施可能是史上最大、最复杂也最烧钱的工程项目之一。从制造芯片、存储、网络设备,到把它们装进服务器、建设超级数据中心,再到为这些设备供电——每一个环节都复杂庞大。可以说,这已经是人类历史上投入最大、成本最高的项目之一了,甚至可能已是最大的。目前我们还处在“半手工”阶段,很多建设工作都是定制的、一次性的,但情况正在改善。我预计未来我们会设计出标准化的“AI 工厂”:从一端输入原材料,比如硅砂,另一端就源源不断地产出AI算力。要达成这点还有很长的路要走,但这是努力的方向。
我们(OpenAI)正倾注巨大的努力来尽可能快速地扩大算力供应。现实是,市场对 AI 算力的需求远远超出了我们的当前供给。GPT-4 推出早期,很多用户排队等模型响应,那种供不应求的局面可能在 GPT-5 发布后再次出现。可以预见,“我们造的计算机永远不够用”将是一段时间内的常态。所以,我个人未来相当长一段时间的关注点都会放在如何大规模建设更多算力上。我们需要把系统规模从现在的“数百万级 GPU”提升到“数亿甚至十亿级 GPU”。
主持人: 扩大算力的过程中,目前最大的挑战是什么?是芯片生产跟不上吗?还是能源供给的问题?
Sam Altman:目前我们碰到的主要瓶颈之一是能源。如果你想建一个 “1 吉瓦级”(gigawatt-scale)的数据中心,短期内找到1吉瓦的电力供应其实非常困难。另外,芯片产能也是限制因素,包括计算芯片和内存芯片。你得把它们组合封装、装入机架,还需要各种各样的配套(比如建筑许可、施工建设等),整个流程有无数环节。理想情况下,我们希望尽可能自动化这些流程。未来如果能让机器人来建设数据中心就太好了——说不定将来我们可以有机器人去建造容纳机器人的工厂,哈哈。我们梦想的目标是:“只要给钱,就能源源不断地自动建好数据中心”。如果能做到这点,将是算力供应的巨大突破。
接下来谈数据。现在这些模型已经太聪明了,以至于简单再喂给它们一本物理教材,收益已经不大了。GPT-5 基本已经掌握了教材里的所有内容。所以我们开始寻求合成数据、让模型自己生成更难的训练环境。我们也非常期待用户帮助我们提出更具挑战性的任务和问题,让模型去解决,从中学习。可以说,数据仍然重要,但我们正进入一个阶段:模型需要学习人类现有数据中不存在的全新知识。它们必须自己去发现新的东西——就像人类科学家提出假说、设计实验、获取结果、不断更新认知那样。
主持人: 听起来,从“学习已知”转向“探索未知”是下一步的关键。模型需要像人类一样真正开始做实验、搞科研,而不仅是消化人类给它的现有知识。
Sam Altman:没错。人类可以自己发现新知识,AI 将来也需要做到这一点。也许未来我们会看到 AI 模型自主提出假说、设计实验,然后惊喜地“告诉”我们一个全新发现。这将是令人激动的时刻。
最后是算法。这方面我们取得的进展其实非常大。OpenAI 引以为傲的一点是,我们建立了一种企业文化,不断实现重大的算法突破。早些年,我们发明了后来大获成功的 GPT 模型范式,又率先探索了将强化学习应用于语言模型提高推理能力。现在我们也在研究一些全新的算法范式。我相信,算法上还有多个数量级的提升空间,远未触顶。
举个例子,就在昨天我们发布了一个开源模型,叫 GPT-OSS。它的智能水平相当于我们以前一个很强的模型(我们叫它 O4Mini),但关键是:它可以在一台笔记本电脑上运行!老实说,几年前如果你问我“什么时候能在本地电脑上跑一个这么智能的模型”,我肯定会说至少还要好多年。但我们找到了一些算法上的新方法(尤其在推理方面),让一个很小的模型也能实现惊人的能力。这种算法层面的突破是最有趣、最酷的,也是我认为这份工作中最精彩的一部分。
主持人: 我能感觉到你谈到这里时整个人都兴奋了起来。对于不了解技术细节的观众来说,能不能请你用更通俗的语言总结一下这种“算法突破”如何改善了用户体验?比如,你提到了 GPT-OSS 在笔记本上运行,这对普通用户意味着什么?还有你说的 GPT-1 到 GPT-4 的算法演进,能否简单回顾一下其重要意义?
Sam Altman:好,让我们从头说起。GPT-1 的核心创意在当时其实颇受业界嘲笑。它的思路是让模型玩一个小游戏:给它一串单词,让它猜下一个单词是什么。这是一种无监督学习,没有标注“这是一只猫”或“这是一只狗”这样的明确指示,只是纯粹让模型根据上下文预测。当时很多专家觉得这方法可笑,质疑模型怎么可能通过这种方式学会真正复杂的概念、掌握物理、数学、编程等知识。
但事实证明,这种方法行得通。模型通过预测下一个词,居然真的自发地学会了非常复杂的概念。想想看,人类婴儿其实也是通过听语言来摸索世界的规律——我们从没给婴儿贴过标签说“这个句子里主语是猫”,他们就是听多了自然悟出语言和世界的关联。GPT-1 也是类似,通过阅读大量文本,它自己内化了语言背后的知识结构。当时 GPT-1 的效果还很一般,毕竟我们只训练了一个相对很小的模型。许多专家见状就断言:“你看吧,这玩意不行的,不具备鲁棒性,永远成不了大器”。
不过我们没有放弃,因为我们发现了所谓的“扩展规律”:模型规模、训练数据、算力——这些投入如果持续增加,模型能力就可以预测地不断提升。换句话说,我们知道只要按公式加大规模,模型性能就会上一个又一个台阶。事实证明,这个扩展策略横跨了好几个数量级都有效,这点在当时是极其出乎意料的,也难怪业界一开始不相信。
后来,我们又尝试了一件当时看来匪夷所思的事:用强化学习来教语言模型学会推理。具体来说,我们让模型在对话中迎合或纠正用户,“这个答案好”“那个答案不好”,借此来引导模型形成链式的思考和推理能力。这听起来很简单,但当时许多人也觉得:“怎么可能?这太天真了。” 然而,这正是 ChatGPT 成功的秘诀之一:GPT-4、GPT-5 在推理上的飞跃,很大程度上来自这种方法。它帮助模型学会了更接近人类的思考方式。
现在,我们手上还有一些在研的新算法方向。我不能透露细节,但我充满期待。也许未来 5-10 年,我们在算法上还会有一系列颠覆性的突破。虽然后面的道路未必像过去 GPT-1 到 GPT-5 这样平滑直线,可能会有很多弯路和反复,但总体的进步轨迹是惊人的。从 GPT-1 当年的“小火苗”,到现在 GPT-5 已经能够在手机上运行、具备这样高度的智能,这种演进速度本身就很科幻。
主持人: 听起来你对未来的算法创新充满信心,也做好了面对曲折的准备。也就是说,进步不会一帆风顺,但总体会不断攀升。OpenAI 甚至曾经在开发 GPT-5 的过程中走过一些“弯路”——比如你提到的那个 Orion 模型,它规模做得太大反而不实用。能不能谈谈从那些经历中你学到了什么?
Sam Altman:是的,我们在研发 GPT-5 的过程中确实走过一些弯路,也纠正了一些策略。具体来说,我们曾经有段时间一味追求模型规模(比如 Orion 就是个超级庞然大物),但后来发现光靠变大并不能解决所有问题。我们忽略了还有另一条提升曲线——也就是通过改进“推理”能力可以用更少的计算实现更好的效果。这就好比我们发现了一条新的、更陡峭的上升曲线,与旧的扩展曲线交叉了。于是我们果断调整策略,没有一味沿着旧路走到底,而是切换到了这条新的轨道。科研就是这样,不断尝试,不断调整。
另一个教训是关于数据。当模型变得非常庞大时,我们处理训练数据的方式也遇到了问题。这提醒我们,当你把系统推向极限时,一些平时不起眼的问题也会变得很大。我们必须更加慎重地对待数据质量、多样性,以及训练策略的细节。总之,这些经历让我们明白,在冲刺超级智能的路上,保持谦逊和警觉是必要的。意料之外的问题总会出现,我们要愿意承认错误、迅速调整。
共同责任:塑造 AI 的未来
主持人: 我注意到,在很多讨论中,人们往往把 AI 的未来完全归因于几家 AI 公司的作为,好像 OpenAI 或其它公司做什么决定,就决定了我们所有人的前途。但事实是,我们每个人也是 AI 未来的参与者:我们是 AI 的使用者,我们用脚投票,也用选票来决定政府如何监管它。所以我想问的是:对于广大公众,你希望我们如何承担自己的责任来确保 AI 往好的方向发展?除了开发者,你对像我们这样的普通人有什么期待?
Sam Altman:这是个非常好的视角。我特别喜欢用“晶体管”打比方。当年,晶体管的发明是一个科学奇迹,带来了指数级的进步。晶体管技术扩散得也很快,几乎渗透到了所有产品中。刚开始时,人们也许会很关注那些造晶体管的公司,但现在我们几乎不提了。当今,我们关注的是谁把晶体管用好了:比如苹果用晶体管造出了智能手机,TikTok 利用智能手机创造了新的社交娱乐形式。真正塑造社会的并不只是那些发明底层技术的公司,而是那些善用这些技术并构建出实际应用的人们。
我想 AI 也会类似。再过些年,人们或许不会过多讨论 OpenAI 或其他基础模型公司,因为 AI 技术将无处不在,成为“理所当然”的底层。大家讨论的将是“某某公司用 AI 做了什么新的产品”,“某某政府用 AI 做了什么决策”,以及我们这些用户如何使用 AI。换句话说,AI 公司只是整个社会搭建的一座脚手架上的一层。我们搭好我们这一层,接下来更宏大的构筑要靠其他所有参与者一层层往上垒建。这其实是社会运转之美——整个社会共同成为了“超级智能”。正因为世世代代每个人都贡献了一块砖,今天我们才能站在先人的肩膀上,拥有如此强大的工具和知识。
所以,如果说有什么对大众的“请求”,那就是:希望每个人都能善用 AI,把它用于积极的用途。就像前面说的——晶体管公司造出了晶体管,但真正改变世界的是那些用晶体管造出计算机、网络和应用的人。同理,AI 最终对世界的影响取决于我们所有人用它来做什么。如果数百万人用它来改善教育、医疗、环境,那么结果会非常不同于如果人们用它传播不实信息或制造冲突。每个人的选择都会累积成 AI 技术发展的方向。
对我个人而言,我一直怀有一种“社会契约”意识:我们这代人享受的是前人创造的一切,我们有责任再添砖加瓦。无数先辈付出了辛勤努力,我们才能走到现在的文明高度。那么现在轮到我们,我们也应努力为后人创造更好的基础。AI 正是这样一个契机:它可以成为造福人类的强大工具,但需要大家一起来塑造和监督。只要我们齐心协力,AI 的未来就会向好的方向倾斜。
主持人: 非常感谢你的分享,Sam。我从你身上感受到的不是那种“科技巨头”高高在上的姿态,而是一种谦逊、敬畏又充满使命感的态度。正如你所说,AI 的未来不仅取决于 OpenAI 这样的公司,也取决于我们每一个人。希望我们所有人都能秉持初心,齐心协力,建设一个因 AI 而更加美好的未来。今天的对话信息量巨大、启发良多,非常感谢你的时间!
Sam Altman:谢谢你的提问和引导。这次谈话让我也收获良多。我对未来既感到兴奋,又怀抱敬畏。我相信只要我们共同努力,我们一定能把 AI 打造成造福全人类的力量。谢谢邀请我来交流!
主持人: 感谢收看本期《巨大的对话》。AI 的未来已经在我们手中萌芽,让我们一起慎重而勇敢地拥抱它。下期再见!