OpenAl DeyDay 2025:从聊天机器人到操作系统
发布于: 2025年10月7日
OpenAI 在 2025 年 10 月举行的第三次 DevDay 标志着一个决定性的转变。
这一次没有更新推出单一的旗舰模型,也没有宣布在 AGI 方面取得的进展,而是将ChatGPT 作为操作系统,并推出了一个工具包,旨在将开发者和企业变成共同创造者。
OpenAI 试图围绕 ChatGPT 建立一个由应用程序和代理组成的自给自足的生态系统,同时通过迷你模式降低进入成本。
从模型到工作流程的支点
《Company》在回顾 DevDay 时指出,OpenAI 的高管们较少谈论抽象模型的进步,而更多地谈论“让人工智能做真正重要的工作”的工具。
有一个令人信服的理由:其主要来自 ChatGPT Plus 的消费者订阅收入仍然远远超过企业 API 收入。 公司首席运营官布拉德-莱特凯普承认,早期的模型在执行商业任务时不够可靠,企业需要能够执行流程的代理。
DevDay 的产品阵容--应用程序 SDK、AgentKit、迷你机型以及新的语音和视频功能--正是瞄准了这一空白。
通过吸引开发者和企业团队,OpenAI 希望建立一个能产生网络效应的平台,最终实现多元化收入。
ChatGPT 中的应用程序
DevDay 的核心是ChatGPT 中的应用程序。
新的应用程序 SDK 允许开发人员在聊天对话中直接嵌入交互式应用程序,而不是 2023 GPT Store(在一个单独的市场中列出自定义 GPT)。
这些应用程序可以显示丰富的界面,在回合中保持状态,并响应自然语言提示。 OpenAI 表示,新系统将向每周 8 亿的 ChatGPT 用户展示应用程序--这是 Booking、Canva、Coursera 和 Zillowfastcompany 等合作伙伴的巨大分销渠道。
SDK 基于开放的模型上下文协议(Model Context Protocol)构建,将支持登录和支付。
即将推出的应用程序目录和收入共享计划表明,OpenAI 正在向苹果的 App Store 学习:通过控制平台,它可以从每笔交易中获取价值。
应用程序不仅仅是噱头。
Fast Company 将此举比作把 ChatGPT 变成了一个“操作系统”。 应用程序可以根据用户的要求在上下文中出现,也可以被明确调用,从而使 ChatGPT 成为学习、购物或计划旅行的仪表板。
然而,集中式分发引发了人们对平台权力、收入分享和隐私的担忧。
OpenAI的指导方针要求制定明确的隐私政策,并尽量减少数据使用;开发者是否遵守这些规则将影响用户的信任度。
AgentKit:简化代理工作流程
AgentKit的发布可以说是最具战略性的。
Sam Altman 将其描述为“一套完整的构建模块”,旨在帮助开发者将代理 “从原型转化为产品”。 在 AgentKit 发布之前,构建自主代理需要同时使用多种工具和手动提示调整。
新套件提供:
代理生成器(Agent Builder)--一个可视化画布,开发人员可以拖放节点来构建多代理工作流、预览运行和跟踪版本。
金融科技公司 Ramp 表示,这将迭代周期缩短了**70%**,使一个代理的构建只需两个冲刺而不是两个季度。LY 公司在两个小时内就完成了多代理工作流的组装。
Connector Registry- 用于管理 Dropbox、Google Drive 和 SharePoint 等数据源的中心,支持第三方模型上下文协议服务器。
Guardrails - 模块化安全层,可屏蔽个人数据并检测越狱。
ChatKit- 可嵌入的聊天组件,可让公司将代理对话集成到自己的产品中。Canva 使用 ChatKit 在一小时内嵌入了一个代理,节省了两周的开发时间。
Evals for Agents- 数据集、跟踪分级和自动提示优化,用于衡量和提高代理性能。
TechCrunch 指出,AgentKit 标志着一种与其他平台竞争的举措,其目的是消除摩擦,使企业能够构建复杂的代理。
VentureBeat补充说,AgentKit可以与Zapier等无代码自动化工具竞争,其测试版功能将逐步推出。
通过整合构建、部署和评估工具,OpenAI 将自己定位为代理工作流的全栈供应商。
对于负责客户支持或销售自动化的专业人士来说,AgentKit降低了实验门槛,但也加深了对OpenAI生态系统的依赖。
迷你模型和价格战
除了开发者工具,OpenAI 还推出了一系列更小、更便宜模型的 API。
这些模型应对了来自谷歌、Anthropic 和其他公司的竞争压力,扩大了对成本敏感的用户的使用范围。
实时迷你型
OpenAI 的实时 API 现在包括gpt-realtime-mini,这是一种语音到语音模型,专为低延迟语音交互而设计。
TechCrunch DevDay 回顾强调,迷你模型比原始实时语音模型**便宜约 70%**,但能提供类似的语音质量。
The Decoder 指出,gpt-realtime-mini 大约便宜 70%,在 API 阵容中与 GPT-5 Pro 和 Sora 2 并列。
Eesel提供的一份深度指南解释了该模型的重要意义:以前的语音管道将语音到文本和文本到语音模型分开,而gpt-realtime-mini则不同,它在单一模型中处理音频输入和输出,减少了延迟,实现了自然对话。
它还引入了富有表现力的语音,如Marin和Cedareesel,支持多模态输入(音频加文本),并提供功能调用以连接外部服务。
gpt-image-1-mini
在图像生成方面,OpenAI 发布了gpt-image-1-mini。 根据该公司的定价页面,文本输入的价格为每百万tokens 2 美元,输出为每百万tokens 8 美元,而图像的输入价格为每百万tokens 2.50美元,输出为每百万 tokens 8 美元。
The Decoder总结说,迷你模式的价格比之前的图像模式大约**低80%**,目标客户是开发基于图像的应用的开发者。 较低的价格为创造性实验打开了大门--小企业可以负担得起生成营销图像或故事板的费用,而无需支付与 GPT-Image-1 相关的高昂费用。
o3-mini 和 GPT-5 Pro
OpenAI 还发布了o3-mini,这是一种针对 STEM 任务进行了优化的高性价比推理模型,可提供更快的延迟和函数调用。
o3-mini 在数学竞赛和编码基准等任务中的表现可与早期模型媲美,甚至更胜一筹,同时与首次发布的 GPT-4 相比,每个 token 的价格**降低了 95%**。
在高端版本中,GPT-5 Pro通过 400,000 个令牌上下文窗口提供扩展推理,并在科学问题上提供最先进的性能。 该模型通过Responses API提供,推理难度设置为 “高”,价格为每百万输入令牌15美元,每百万输出令牌120美元。
迷你模型和高级模型的并存表明,OpenAI 希望细分市场--为入门级任务提供经济实惠的选择,同时为深度研究和企业级工作负载收取溢价。
Sora 2 和生成视频的挑战
OpenAI 最引人注目的演示是Sora 2,这是一个升级版视频模型,可以生成符合物理定律的逼真剪辑。
该公司将从最初的 Sora 到 Sora 2 的飞跃比喻为从 GPT-1 到 GPT-3.5。
Sora 2 可以模拟世界物理原理--球从后场篮板反弹而不是瞬移,还能处理奥运套路等复杂镜头。
它还集成了背景音效,并能在生成的场景中插入真人的肖像和声音。
Sora 社交应用是此次发布的一个重要部分。 用户可以创建和混音视频,将自己插入到场景中,并参与旨在鼓励创造力。
安全功能包括家长控制、青少年使用限制以及禁止插入客串。
TechCrunch报道称,OpenAI因对受版权保护的角色采取选择退出的方式而遭到反弹,现在计划对版权进行细粒度的选择性控制。
山姆-奥特曼承认,视频生成的收入来源仍不明确,OpenAI可能需要与版权持有者分享收入。
对于在 TikTok 上 remix 内容长大的一代人来说,Sora 提供了前所未有的创造力,但它的成功将取决于负责任的版权处理和可持续的商业模式。
法典成为主流
当 GPT-5 等模型成为头条新闻时,OpenAI 的编程助手Codex却悄悄地从研究预览版过渡到了通用版。
自 5 月份以来,Codex 的日使用量增加了10 倍以上,OpenAI 的工程师每周在使用时合并的**拉取请求增加了 70%**。
通用版本引入了Slack 集成,使开发人员能够直接通过团队聊天提出问题或委派任务。
Codex SDK允许公司将 Codex 嵌入到自己的工具中,提供结构化输出、上下文管理和代码简历功能。
新的管理工具让企业客户可以控制环境设置和使用分析。
思科(Cisco)等早期用户报告说,Codex 将代码审查时间缩短了**50%**,而 Instacart 则使用 SDK 自动清理代码并加快工程速度。
这些改进表明,OpenAI 希望 Codex 成为企业软件开发的标准组成部分,进一步将其模型嵌入到专业工作流程中。
行业影响:平台游戏与竞争压力
综合来看,DevDay 的内容揭示了一个双管齐下的战略:
1. 建立平台生态系统。
通过将 ChatGPT 转变为应用程序和代理的分发中心,OpenAI 试图复制智能手机操作系统的成功。
AgentKit和ChatKit等开发者工具降低了构建代理应用程序的摩擦,而应用程序目录则有望带来新的收入来源。
FinancialContent 的分析认为,这些产品的推出 “从根本上重塑了人工智能应用开发的格局”,将 ChatGPT 变成了 “一个新兴的人工智能操作系统 ”。
《Fast Company》杂志认为,ChatGPT 的发展可以帮助企业最终看到人工智能的回报。
对于开发者和初创企业来说,该平台提供了覆盖范围和现成的基础设施;对于用户来说,它承诺为许多任务提供单一界面。然而,一个成功的平台也将巩固OpenAI的守门人角色,并可能扩大人们对数据隐私和平台依赖性的担忧。
2. 价格细分和竞相降价。
VentureBeat 的预览指出,来自谷歌的 Gemini 和 Anthropic 的 Claude 的竞争缩小了技术性能差异,并引发了价格战。
作为回应,OpenAI发布了大幅降低成本的迷你型号(o3-mini、gpt-realtime-mini、gpt-image-1-mini),同时为高风险应用提供了GPT-5 Pro等高级型号。
定价页面显示,gpt-realtime-mini 的成本为每百万文本输入tokens 0.60 美元,每百万输出tokens 2.40 美元,而标准实时模型的成本分别为 4 美元和 16 美元。
在音频方面,迷你模型的成本为每百万输入tokens 10 美元,而完整模型的成本为 32 美元。
这些降价旨在吸引呼叫中心和社交媒体平台等大流量应用,但同时也挤压了本已面临天文数字计算费用的行业的利润空间。
展望未来:机遇与挑战
在 ChatGPT 中运行应用程序的能力可以简化日常任务--从计划旅行到管理财务--同时,AgentKit 为那些构建人工智能驱动的工作流程的人提供了就业机会。
迷你模式将语音和视频等高级功能平民化,让初创企业和独立创作者可以进行尝试,而无需承担高昂的成本。
与此同时,平台的集中化也带来了一些问题:
经济可持续性。
培训和服务大型模型的成本仍然很高。Lightcap 暗示,企业发展是实现的必要条件。
引入迷你模型和社交视频应用增加了计算需求;目前还不清楚公司将如何为这些服务提供长期资金,或与版权持有者分享收入。
监管和版权。
Sora 的客串功能引发了对未经授权使用知识产权的担忧。OpenAI转向选择性控制强调了明确许可框架的必要性。对合成媒体和生物特征隐私的更广泛监管可能会随之而来。
竞争与互操作性。
谷歌和微软正在开发自己的代理框架和语音模型。模型上下文协议》(Model Context Protocol)等开放标准可能会促进跨平台代理的发展,但 “锁定”(lock-in)仍然是一个风险。对于开发者来说,可能有必要在多个生态系统之间进行对冲。
正在形成的平台战略
2025 年 DevDay 标志着 OpenAI 的成熟。
没有展示单一的突破,而是推出了一套工具和模型,共同将 ChatGPT 从一个对话产品重新定位为一个新生的人工智能操作系统。
ChatGPT 中的应用程序、AgentKit、迷你模型以及向语音和视频领域的扩展都服务于一个更大的目标:建立一个平台,让开发者不断创新,让用户持续参与,让 OpenAI 在整个堆栈中获取价值。
这一演变提供了强大的新功能,但同时也要求他们对平台动态、数据使用和合成媒体的道德规范有深刻的认识。
OpenAI 能否在这些雄心壮志与可持续的商业模式和负责任的管理之间取得平衡,将决定其平台梦想能否成为持久的现实。