AI Builders 日报 — 2026年5月14日

🔥 今日高光

1. Waymo 把 autonomous driving 讲成了一个“系统工程”问题，而不只是模型问题

Waymo 联合 CEO Dmitri Dolgov 这次最值得记住的观点，是他把自动驾驶拆成了 driver / simulator / critic 三层能力，并明确说 Waymo 的 foundation model 虽然是 end-to-end，但真正能落地到超大规模、superhuman safety 的关键，在于还要叠加结构化中间表示、运行时校验、闭环训练与评估。

🔗 原文 / 视频

2. Waymo 的护城河，不只是技术领先，而是穿越 hype cycle 的耐力

Dmitri Dolgov 反复强调，自动驾驶是一个“前 90% 看起来进展飞快，最后 10% 极其漫长”的问题。很多公司能靠 breakthrough 快速起步，但很难把系统做成真正可商用、可扩张、可承担生命安全责任的产品。Waymo 过去二十年的核心资产，某种程度上就是这种长期主义和对安全边界的执着。

🔗 原文 / 视频

3. Anthropic 正在把“跳过审批”重新做成一个安全产品

Anthropic Engineering 发布的 Claude Code auto mode 很有代表性。它不是简单取消权限提示，而是用两层模型化防线替代人工批准：一层检查工具输出里的 prompt injection，另一层在执行前审核 agent 的动作是否越权。这个方向很重要，因为它回答了一个越来越现实的问题：当 agent 越来越能干时，怎么避免 approval fatigue，又不直接滑向危险的 full autonomy。

🔗 原文

📝 官方 Blog

Anthropic Engineering：Claude Code auto mode，用更低摩擦的方式替代手动审批

这篇文章讲清了 Claude Code auto mode 的设计目标：在“每一步都人工 approve”和“--dangerously-skip-permissions 完全放开”之间，做一个更实用的中间层。Anthropic 观察到，人工审批虽然安全，但长期使用会形成 approval fatigue，用户最后往往只是机械点通过。与其假装人工审批永远可靠，不如把真正危险的动作筛出来，把大多数低风险动作自动放行。

它的核心机制有两层。第一层是 prompt-injection probe，在 file read、web fetch、shell output 等工具结果进入 agent 上下文前，先检测其中是否有试图劫持行为的内容。第二层是 transcript classifier，在工具执行前判断动作是否越权、是否会跨越 trust boundary、是否涉及破坏性操作或 data exfiltration。Anthropic 还专门强调，classifier 只看用户消息和工具调用，不看 assistant 自己的解释文本，也尽量不看工具输出，以降低被模型“说服”或被注入内容污染的风险。

最有意思的是它公开了真实取舍。文章给出的 deployed pipeline 指标里，full pipeline 在真实内部流量上的 false positive rate 是 0.4%，但在真实 overeager action 数据集上的 false-negative rate 仍有 17%。Anthropic 没把它包装成“完美自动驾驶式安全系统”，而是非常直白地说：auto mode 明显比完全跳过权限更安全，但它不是高风险基础设施场景下 careful human review 的替代品。这种诚实反而很有价值，因为它把 agent safety 从口号拉回到了工程现实。

一句很值得记住的话是：“Auto mode is meant to replace –dangerously-skip-permissions without bringing back interruptions.” 这几乎点明了未来 agent 产品设计的一个主线 - 不是把人完全拿掉，而是把“该拦什么、不该拦什么”交给更细粒度的系统来判断。

🔗 原文

🎧 Podcast

Training Data：Waymo 的 Dmitri Dolgov，讲清 2000 万次 ride 背后的技术和耐力

The Takeaway： Waymo 的真正壁垒，不是“做出了自动驾驶 demo”，而是把 autonomous driving 这件事从研究问题一路做成了一个可以规模化、可验证、并且持续提升 safety 的产品系统。

Waymo 联合 CEO Dmitri Dolgov 的思路非常清楚。他不是把自动驾驶讲成某个单点模型的胜利，而是讲成一个长期堆系统能力的过程。Waymo 内部的 foundation model 同时服务于 driver、simulator 和 critic 三个核心环节，本质上是一个 multimodal、world-action、language-aligned 的系统。换句话说，它既要理解物理世界和其他交通参与者的行为，也要知道“一个好司机应该怎么做”，还要能被放进真实道路环境中稳定运行。

他对 end-to-end 的判断也很值得 builder 们记住。Dmitri 直接说，Waymo 的 foundation model 本身就是 end-to-end，但“end-to-end vs. 其他方法”是个假问题。真正的问题是：如果你想做到 fully autonomous、superhuman safety、并且跑上数亿英里规模，光有一个 vanilla end-to-end system 远远不够。你还需要结构化中间表示、运行时额外校验、闭环训练、闭环评估，以及能承受现实世界长尾问题的系统工程。

他有一句话很能概括 Waymo 的长期主义：“It’s very easy to get started, but it’s very difficult to take it all the way to a real product, full autonomy, and superhuman performance.” 这句话不只适用于自动驾驶，也很适用于今天的 agent 和 robotics。很多团队能用新模型快速做出惊艳起步，但真正难的是把能力磨成产品，把产品磨成规模，再把规模磨成可靠性。

另一个强信号是 Waymo 已经进入明显的规模拐点。Dolgov 提到，Waymo 已完成超过 20 million fully autonomous rides，其中后 10 million 只用了最近 7 个月。这说明它已经从“技术可行”阶段，开始迈向“商业化加速复制”阶段。对 AI builder 来说，这期内容最大的价值，是提醒大家别把 world model、foundation model、end-to-end 这些词当成 marketing label；真正的胜负，最后还是落在系统设计、验证机制和穿越周期的耐力上。

🔗 收听 / 观看

Generated through the Follow Builders skill: https://github.com/zarazhangrui/follow-builders

🔥 今日高光#

1. Waymo 把 autonomous driving 讲成了一个“系统工程”问题，而不只是模型问题#

2. Waymo 的护城河，不只是技术领先，而是穿越 hype cycle 的耐力#

3. Anthropic 正在把“跳过审批”重新做成一个安全产品#

📝 官方 Blog#

Anthropic Engineering：Claude Code auto mode，用更低摩擦的方式替代手动审批#

🎧 Podcast#

Training Data：Waymo 的 Dmitri Dolgov，讲清 2000 万次 ride 背后的技术和耐力#