周期:北京时间 2026-05-10 ~ 2026-05-16
本期重点:这周最值得注意的变化,不是新的旗舰模型横空出世,而是 AI 产品正在快速进入“可部署、可治理、可持续协作”的阶段。
🔥 本周热点
1. ChatGPT 上线 personal finance 预览,AI 开始真正接入高敏感个人上下文
OpenAI 于 5 月 15 日面向美国 ChatGPT Pro 用户推出 personal finance experience 预览。用户可通过 Plaid 连接金融账户,在 ChatGPT 里查看 spending、subscriptions、upcoming payments、portfolio performance,并基于真实财务上下文直接提问。
这件事的重要性不在“又多了个功能”,而在于 ChatGPT 正在从通用问答入口,深入到高敏感、高决策密度的个人场景。一旦财务、健康、工作流等高价值上下文被接入,AI 产品的护城河会从“模型能力”进一步转向“上下文深度 + 可信交互 + 安全治理”。
来源:https://openai.com/index/personal-finance-chatgpt/
2. Codex 进手机,agent 工作流开始脱离桌面
OpenAI 于 5 月 14 日宣布 Codex 进入 ChatGPT mobile app。用户可以在手机上查看活跃线程、审批命令、切换模型、查看 terminal output / diffs / screenshots,并通过 secure relay 连接自己正在运行 Codex 的 laptop、devbox 或 remote environment。
这说明 agent 产品的竞争,正在从“能不能写代码”转向 能不能处理长任务、异步协作、跨设备接力和实时审批。谁能把 agent 做成真正的工作流层,而不只是一次性对话工具,谁就更接近日常生产环境。
来源:https://openai.com/index/work-with-codex-from-anywhere/
3. OpenAI 成立 Deployment Company,开始直接做企业级落地
OpenAI 于 5 月 11 日宣布成立 OpenAI Deployment Company(DeployCo),并将通过大量 Forward Deployed Engineers 深入企业现场,帮助客户把 frontier AI 接进真实业务流程。官方同时披露,该业务以超 40 亿美元 初始投资启动,并计划通过收购和合作加速扩张。
这背后释放的信号很明确:企业 AI 的瓶颈不再主要是“模型不够强”,而是“部署不到位、流程没重构、系统没接上、治理没做好”。 OpenAI 亲自下场做 deployment,本质上是在押注“服务 + 平台 + 交付”一体化会成为下一阶段的重要商业模式。
来源:https://openai.com/index/openai-launches-the-deployment-company/
4. Anthropic 把 AI 地缘竞争直接推上台面,行业讨论从 capability 转向 global leadership
Anthropic 于 5 月 14 日发布政策研究 “2028: Two scenarios for global AI leadership”,明确讨论美国与中国在 frontier AI 上的竞争、compute export controls、model distillation、以及 AI 规则究竟由谁制定。
这篇文章之所以热,不是因为它提出了全新技术,而是因为它再次把一个已经在政策圈发酵的问题拉回公众视野:未来几年 AI 竞争不只是实验室之间的 benchmark battle,而是产业政策、算力供应链、国家安全与全球规范的综合博弈。
来源:https://www.anthropic.com/research/2028-ai-leadership
5. NVIDIA 持续把 agents 推向生产:本地 agent、企业 agent、RL infrastructure 同时加速
这一周,NVIDIA 连续释放多个与 agent 相关的信号:
- 5 月 13 日介绍 Hermes Agent + Qwen 3.6 + RTX / DGX Spark 的本地 agent 方案
- 5 月 12 日宣布 SAP Business AI Platform 嵌入 OpenShell,为 enterprise agents 提供 runtime security layer
- 5 月 13 日又与 Ineffable Intelligence 合作,布局大规模 reinforcement learning infrastructure
这些动作说明,agent 赛道正在同时向三个方向推进:consumer/local、enterprise/governance、training/infrastructure。这比单点产品发布更值得关注。
来源:
- https://blogs.nvidia.com/blog/rtx-ai-garage-hermes-agent-dgx-spark/
- https://blogs.nvidia.com/blog/sap-specialized-agents/
- https://blogs.nvidia.com/blog/ineffable-intelligence-reinforcement-learning-infrastructure/
🛠️ 新工具 / 产品发布
1. ChatGPT Finances(preview)
面向美国 ChatGPT Pro 用户开放的个人财务体验,支持连接 12,000+ 金融机构账户,在 ChatGPT 内进行 spend analysis、dashboard 查看和基于真实财务上下文的问答。
来源:https://openai.com/index/personal-finance-chatgpt/
2. Codex in ChatGPT mobile app
Codex 正式进入 ChatGPT 手机端,支持远程查看任务状态、审批命令、查看输出和继续推进 agent 线程。
来源:https://openai.com/index/work-with-codex-from-anywhere/
3. Remote SSH(GA)for Codex
Codex 的 Remote SSH 进入 generally available,可直接接入受管 remote environments,在企业/团队开发环境中运行任务。
来源:https://openai.com/index/work-with-codex-from-anywhere/
4. Codex Hooks(GA)
Hooks 现已 GA,可用于 secrets scanning、validators、conversation logging、memory creation,以及按 repo / directory 自定义行为。
来源:https://openai.com/index/work-with-codex-from-anywhere/
5. Programmatic access tokens for Codex
面向 Enterprise / Business 计划推出的 scoped credentials,可用于 CI pipelines、release workflows 和内部自动化。
来源:https://openai.com/index/work-with-codex-from-anywhere/
6. OpenAI Deployment Company
严格来说它不是单一“工具”,而是 OpenAI 直接下场做 AI deployment 的新业务与交付平台,值得所有做 enterprise AI 的团队关注。
来源:https://openai.com/index/openai-launches-the-deployment-company/
7. ChatGPT safety summaries for sensitive conversations
OpenAI 公布新 safety update:在 rare, high-risk 场景下,系统会生成短时保留的 safety summaries,帮助模型跨上下文更准确识别自伤 / 他伤风险。
来源:https://openai.com/index/chatgpt-recognize-context-in-sensitive-conversations/
8. Hermes Agent + local runtime stack
Nous Research 的 Hermes Agent 借助 NVIDIA RTX / DGX Spark 及 Qwen 3.6,本地 agent 体验进一步成熟,强调 self-evolving skills、contained sub-agents 与 always-on local use。
来源:https://blogs.nvidia.com/blog/rtx-ai-garage-hermes-agent-dgx-spark/
9. OpenShell in SAP Business AI Platform
SAP 将 NVIDIA OpenShell 嵌入 SAP Business AI Platform,让 custom agents 和 Joule Studio 构建的企业 agents 具备更强的 runtime isolation、policy enforcement 与 governance。
来源:https://blogs.nvidia.com/blog/sap-specialized-agents/
10. NemoClaw in Joule Studio
NemoClaw 将可直接在 Joule Studio 中使用,为企业构建 autonomous agents 提供从开发到可信上线的 blueprint。
来源:https://blogs.nvidia.com/blog/sap-specialized-agents/
📊 模型更新
先说结论:本周没有真正意义上的“新旗舰通用模型”公开发布
如果你期待的是类似 GPT / Claude / Gemini 的大版本正面开打,这周并没有出现新的顶级 frontier model 正式发布。相反,行业重心明显偏向 产品化、垂直场景、部署与治理。
GPT‑5.5 Thinking:开始更深地进入垂直高价值场景
OpenAI 在 ChatGPT Finances 预览中披露,连接财务账户后的对话默认使用 GPT‑5.5 Thinking。这说明 GPT‑5.5 系列开始更多承担需要复杂推理、强上下文理解和更高可靠性的垂直任务。
来源:https://openai.com/index/personal-finance-chatgpt/
GPT‑5.5 Instant:安全识别能力继续增强
OpenAI 在 sensitive conversations 更新中提到,GPT‑5.5 Instant 在 harm-to-others、suicide 和 self-harm 等场景下,借助 safety summaries 后 safe-response performance 明显提升。这不是新模型发布,但属于非常实用的 safety capability update。
来源:https://openai.com/index/chatgpt-recognize-context-in-sensitive-conversations/
Qwen 3.6 27B / 35B:本地 agent 栈里的高关注模型
NVIDIA 本周在 Hermes 文章中重点提到 Qwen 3.6 27B / 35B,强调其在本地 agent 场景中的高性能与更小 footprint。虽然这不是该模型的首发公告,但它清楚反映出:2026 年模型更新的一个主旋律,是“更适合 local agent / edge deployment 的中等规模高性能 open-weight 模型”。
来源:https://blogs.nvidia.com/blog/rtx-ai-garage-hermes-agent-dgx-spark/
💡 值得关注的趋势
1. AI 的主战场,正从“发模型”转向“接工作流”
这周最强烈的共同信号是:
- ChatGPT 接入真实财务上下文
- Codex 支持跨设备、跨环境协作
- OpenAI 亲自做 deployment
这说明模型能力正在成为底层条件,真正的竞争开始上移到 workflow integration、context depth、approval loops、deployment quality。
2. Agent 正在分化成三条清晰路线
目前已经能看到三条并行路线:
- 个人 / 本地 agent:Hermes + Qwen 3.6 + RTX
- 开发 agent:Codex mobile + Remote SSH + Hooks
- 企业 agent:SAP + OpenShell + NemoClaw
未来的 agent 市场,未必会由单一通用 agent 吃掉一切,更可能是不同层级、不同可信边界下的多形态生态。
3. AI 部署服务会成为大生意
OpenAI Deployment Company 的出现非常关键。它说明一个现实:很多企业不是缺模型,而是缺能把模型接进流程、数据、权限系统和 KPI 的人。deployment layer 很可能会成为未来 2 年 AI 商业化里最被低估、但最赚钱的部分之一。
4. 安全和治理正在从“附属功能”变成产品核心卖点
不管是 OpenAI 的 safety summaries,还是 SAP / NVIDIA 强调的 runtime isolation、policy enforcement、audit trail,都说明一件事:当 AI 开始接入真实系统,安全不再是合规部门的附加项,而是产品是否能上线的前提条件。
5. AI 竞争越来越像“技术 + 基础设施 +地缘政治”的联动系统
Anthropic 的政策文和 NVIDIA 的基础设施动作一起看,会发现 frontier AI 竞争已经很难只用产品视角理解。compute、chip export controls、distillation、防御性应用、企业 adoption,这些因素已经深度耦合。
结语
这周如果只看 headline,可能会觉得“没有谁又发一个震撼全网的新模型”。
但从更长线看,这反而是更重要的一周:AI 正在从 demo 文化,切到 deployment 文化。
接下来值得盯的,不只是哪个实验室再把 benchmark 拉高 2 个点,而是谁能把 AI 真正做进:
- 个人的高价值决策
- 团队的长任务协作
- 企业的生产系统
- 以及可审计、可治理、可持续扩张的基础设施里。