AI 周报 — 2026年5月第3周

周期：北京时间 2026-05-10 ~ 2026-05-16
本期重点：这周最值得注意的变化，不是新的旗舰模型横空出世，而是 AI 产品正在快速进入“可部署、可治理、可持续协作”的阶段。

🔥 本周热点

1. ChatGPT 上线 personal finance 预览，AI 开始真正接入高敏感个人上下文

OpenAI 于 5 月 15 日面向美国 ChatGPT Pro 用户推出 personal finance experience 预览。用户可通过 Plaid 连接金融账户，在 ChatGPT 里查看 spending、subscriptions、upcoming payments、portfolio performance，并基于真实财务上下文直接提问。

这件事的重要性不在“又多了个功能”，而在于 ChatGPT 正在从通用问答入口，深入到高敏感、高决策密度的个人场景。一旦财务、健康、工作流等高价值上下文被接入，AI 产品的护城河会从“模型能力”进一步转向“上下文深度 + 可信交互 + 安全治理”。

来源：https://openai.com/index/personal-finance-chatgpt/

2. Codex 进手机，agent 工作流开始脱离桌面

OpenAI 于 5 月 14 日宣布 Codex 进入 ChatGPT mobile app。用户可以在手机上查看活跃线程、审批命令、切换模型、查看 terminal output / diffs / screenshots，并通过 secure relay 连接自己正在运行 Codex 的 laptop、devbox 或 remote environment。

这说明 agent 产品的竞争，正在从“能不能写代码”转向 能不能处理长任务、异步协作、跨设备接力和实时审批。谁能把 agent 做成真正的工作流层，而不只是一次性对话工具，谁就更接近日常生产环境。

来源：https://openai.com/index/work-with-codex-from-anywhere/

3. OpenAI 成立 Deployment Company，开始直接做企业级落地

OpenAI 于 5 月 11 日宣布成立 OpenAI Deployment Company（DeployCo），并将通过大量 Forward Deployed Engineers 深入企业现场，帮助客户把 frontier AI 接进真实业务流程。官方同时披露，该业务以超 40 亿美元 初始投资启动，并计划通过收购和合作加速扩张。

这背后释放的信号很明确：企业 AI 的瓶颈不再主要是“模型不够强”，而是“部署不到位、流程没重构、系统没接上、治理没做好”。 OpenAI 亲自下场做 deployment，本质上是在押注“服务 + 平台 + 交付”一体化会成为下一阶段的重要商业模式。

来源：https://openai.com/index/openai-launches-the-deployment-company/

4. Anthropic 把 AI 地缘竞争直接推上台面，行业讨论从 capability 转向 global leadership

Anthropic 于 5 月 14 日发布政策研究 “2028: Two scenarios for global AI leadership”，明确讨论美国与中国在 frontier AI 上的竞争、compute export controls、model distillation、以及 AI 规则究竟由谁制定。

这篇文章之所以热，不是因为它提出了全新技术，而是因为它再次把一个已经在政策圈发酵的问题拉回公众视野：未来几年 AI 竞争不只是实验室之间的 benchmark battle，而是产业政策、算力供应链、国家安全与全球规范的综合博弈。

来源：https://www.anthropic.com/research/2028-ai-leadership

5. NVIDIA 持续把 agents 推向生产：本地 agent、企业 agent、RL infrastructure 同时加速

这一周，NVIDIA 连续释放多个与 agent 相关的信号：

5 月 13 日介绍 Hermes Agent + Qwen 3.6 + RTX / DGX Spark 的本地 agent 方案
5 月 12 日宣布 SAP Business AI Platform 嵌入 OpenShell，为 enterprise agents 提供 runtime security layer
5 月 13 日又与 Ineffable Intelligence 合作，布局大规模 reinforcement learning infrastructure

这些动作说明，agent 赛道正在同时向三个方向推进：consumer/local、enterprise/governance、training/infrastructure。这比单点产品发布更值得关注。

来源：

🛠️ 新工具 / 产品发布

1. ChatGPT Finances（preview）

面向美国 ChatGPT Pro 用户开放的个人财务体验，支持连接 12,000+ 金融机构账户，在 ChatGPT 内进行 spend analysis、dashboard 查看和基于真实财务上下文的问答。

来源：https://openai.com/index/personal-finance-chatgpt/

2. Codex in ChatGPT mobile app

Codex 正式进入 ChatGPT 手机端，支持远程查看任务状态、审批命令、查看输出和继续推进 agent 线程。

来源：https://openai.com/index/work-with-codex-from-anywhere/

3. Remote SSH（GA）for Codex

Codex 的 Remote SSH 进入 generally available，可直接接入受管 remote environments，在企业/团队开发环境中运行任务。

来源：https://openai.com/index/work-with-codex-from-anywhere/

4. Codex Hooks（GA）

Hooks 现已 GA，可用于 secrets scanning、validators、conversation logging、memory creation，以及按 repo / directory 自定义行为。

来源：https://openai.com/index/work-with-codex-from-anywhere/

5. Programmatic access tokens for Codex

面向 Enterprise / Business 计划推出的 scoped credentials，可用于 CI pipelines、release workflows 和内部自动化。

来源：https://openai.com/index/work-with-codex-from-anywhere/

6. OpenAI Deployment Company

严格来说它不是单一“工具”，而是 OpenAI 直接下场做 AI deployment 的新业务与交付平台，值得所有做 enterprise AI 的团队关注。

来源：https://openai.com/index/openai-launches-the-deployment-company/

7. ChatGPT safety summaries for sensitive conversations

OpenAI 公布新 safety update：在 rare, high-risk 场景下，系统会生成短时保留的 safety summaries，帮助模型跨上下文更准确识别自伤 / 他伤风险。

来源：https://openai.com/index/chatgpt-recognize-context-in-sensitive-conversations/

8. Hermes Agent + local runtime stack

Nous Research 的 Hermes Agent 借助 NVIDIA RTX / DGX Spark 及 Qwen 3.6，本地 agent 体验进一步成熟，强调 self-evolving skills、contained sub-agents 与 always-on local use。

来源：https://blogs.nvidia.com/blog/rtx-ai-garage-hermes-agent-dgx-spark/

9. OpenShell in SAP Business AI Platform

SAP 将 NVIDIA OpenShell 嵌入 SAP Business AI Platform，让 custom agents 和 Joule Studio 构建的企业 agents 具备更强的 runtime isolation、policy enforcement 与 governance。

来源：https://blogs.nvidia.com/blog/sap-specialized-agents/

10. NemoClaw in Joule Studio

NemoClaw 将可直接在 Joule Studio 中使用，为企业构建 autonomous agents 提供从开发到可信上线的 blueprint。

来源：https://blogs.nvidia.com/blog/sap-specialized-agents/

📊 模型更新

先说结论：本周没有真正意义上的“新旗舰通用模型”公开发布

如果你期待的是类似 GPT / Claude / Gemini 的大版本正面开打，这周并没有出现新的顶级 frontier model 正式发布。相反，行业重心明显偏向 产品化、垂直场景、部署与治理。

GPT‑5.5 Thinking：开始更深地进入垂直高价值场景

OpenAI 在 ChatGPT Finances 预览中披露，连接财务账户后的对话默认使用 GPT‑5.5 Thinking。这说明 GPT‑5.5 系列开始更多承担需要复杂推理、强上下文理解和更高可靠性的垂直任务。

来源：https://openai.com/index/personal-finance-chatgpt/

GPT‑5.5 Instant：安全识别能力继续增强

OpenAI 在 sensitive conversations 更新中提到，GPT‑5.5 Instant 在 harm-to-others、suicide 和 self-harm 等场景下，借助 safety summaries 后 safe-response performance 明显提升。这不是新模型发布，但属于非常实用的 safety capability update。

来源：https://openai.com/index/chatgpt-recognize-context-in-sensitive-conversations/

Qwen 3.6 27B / 35B：本地 agent 栈里的高关注模型

NVIDIA 本周在 Hermes 文章中重点提到 Qwen 3.6 27B / 35B，强调其在本地 agent 场景中的高性能与更小 footprint。虽然这不是该模型的首发公告，但它清楚反映出：2026 年模型更新的一个主旋律，是“更适合 local agent / edge deployment 的中等规模高性能 open-weight 模型”。

来源：https://blogs.nvidia.com/blog/rtx-ai-garage-hermes-agent-dgx-spark/

💡 值得关注的趋势

1. AI 的主战场，正从“发模型”转向“接工作流”

这周最强烈的共同信号是：

ChatGPT 接入真实财务上下文
Codex 支持跨设备、跨环境协作
OpenAI 亲自做 deployment

这说明模型能力正在成为底层条件，真正的竞争开始上移到 workflow integration、context depth、approval loops、deployment quality。

2. Agent 正在分化成三条清晰路线

目前已经能看到三条并行路线：

个人 / 本地 agent：Hermes + Qwen 3.6 + RTX
开发 agent：Codex mobile + Remote SSH + Hooks
企业 agent：SAP + OpenShell + NemoClaw

未来的 agent 市场，未必会由单一通用 agent 吃掉一切，更可能是不同层级、不同可信边界下的多形态生态。

3. AI 部署服务会成为大生意

OpenAI Deployment Company 的出现非常关键。它说明一个现实：很多企业不是缺模型，而是缺能把模型接进流程、数据、权限系统和 KPI 的人。deployment layer 很可能会成为未来 2 年 AI 商业化里最被低估、但最赚钱的部分之一。

4. 安全和治理正在从“附属功能”变成产品核心卖点

不管是 OpenAI 的 safety summaries，还是 SAP / NVIDIA 强调的 runtime isolation、policy enforcement、audit trail，都说明一件事：当 AI 开始接入真实系统，安全不再是合规部门的附加项，而是产品是否能上线的前提条件。

5. AI 竞争越来越像“技术 + 基础设施 +地缘政治”的联动系统

Anthropic 的政策文和 NVIDIA 的基础设施动作一起看，会发现 frontier AI 竞争已经很难只用产品视角理解。compute、chip export controls、distillation、防御性应用、企业 adoption，这些因素已经深度耦合。

结语

这周如果只看 headline，可能会觉得“没有谁又发一个震撼全网的新模型”。

但从更长线看，这反而是更重要的一周：AI 正在从 demo 文化，切到 deployment 文化。

接下来值得盯的，不只是哪个实验室再把 benchmark 拉高 2 个点，而是谁能把 AI 真正做进：

个人的高价值决策
团队的长任务协作
企业的生产系统
以及可审计、可治理、可持续扩张的基础设施里。

🔥 本周热点#

1. ChatGPT 上线 personal finance 预览，AI 开始真正接入高敏感个人上下文#

2. Codex 进手机，agent 工作流开始脱离桌面#

3. OpenAI 成立 Deployment Company，开始直接做企业级落地#

4. Anthropic 把 AI 地缘竞争直接推上台面，行业讨论从 capability 转向 global leadership#

5. NVIDIA 持续把 agents 推向生产：本地 agent、企业 agent、RL infrastructure 同时加速#

🛠️ 新工具 / 产品发布#

1. ChatGPT Finances（preview）#

2. Codex in ChatGPT mobile app#

3. Remote SSH（GA）for Codex#

4. Codex Hooks（GA）#

5. Programmatic access tokens for Codex#

6. OpenAI Deployment Company#

7. ChatGPT safety summaries for sensitive conversations#

8. Hermes Agent + local runtime stack#

9. OpenShell in SAP Business AI Platform#

10. NemoClaw in Joule Studio#

📊 模型更新#

先说结论：本周没有真正意义上的“新旗舰通用模型”公开发布#

GPT‑5.5 Thinking：开始更深地进入垂直高价值场景#

GPT‑5.5 Instant：安全识别能力继续增强#

Qwen 3.6 27B / 35B：本地 agent 栈里的高关注模型#

💡 值得关注的趋势#

1. AI 的主战场，正从“发模型”转向“接工作流”#

2. Agent 正在分化成三条清晰路线#

3. AI 部署服务会成为大生意#

4. 安全和治理正在从“附属功能”变成产品核心卖点#

5. AI 竞争越来越像“技术 + 基础设施 +地缘政治”的联动系统#

结语#

🔥 本周热点

1. ChatGPT 上线 personal finance 预览，AI 开始真正接入高敏感个人上下文

2. Codex 进手机，agent 工作流开始脱离桌面

3. OpenAI 成立 Deployment Company，开始直接做企业级落地

4. Anthropic 把 AI 地缘竞争直接推上台面，行业讨论从 capability 转向 global leadership

5. NVIDIA 持续把 agents 推向生产：本地 agent、企业 agent、RL infrastructure 同时加速

🛠️ 新工具 / 产品发布

1. ChatGPT Finances（preview）

2. Codex in ChatGPT mobile app

3. Remote SSH（GA）for Codex

4. Codex Hooks（GA）

5. Programmatic access tokens for Codex

6. OpenAI Deployment Company

7. ChatGPT safety summaries for sensitive conversations

8. Hermes Agent + local runtime stack

9. OpenShell in SAP Business AI Platform

10. NemoClaw in Joule Studio

📊 模型更新

先说结论：本周没有真正意义上的“新旗舰通用模型”公开发布

GPT‑5.5 Thinking：开始更深地进入垂直高价值场景

GPT‑5.5 Instant：安全识别能力继续增强

Qwen 3.6 27B / 35B：本地 agent 栈里的高关注模型

💡 值得关注的趋势

1. AI 的主战场，正从“发模型”转向“接工作流”

2. Agent 正在分化成三条清晰路线

3. AI 部署服务会成为大生意

4. 安全和治理正在从“附属功能”变成产品核心卖点

5. AI 竞争越来越像“技术 + 基础设施 +地缘政治”的联动系统

结语