🔥 今日高光
1. Waymo 把 autonomous driving 讲成了一个“系统工程”问题,而不只是模型问题
Waymo 联合 CEO Dmitri Dolgov 这次最值得记住的观点,是他把自动驾驶拆成了 driver / simulator / critic 三层能力,并明确说 Waymo 的 foundation model 虽然是 end-to-end,但真正能落地到超大规模、superhuman safety 的关键,在于还要叠加结构化中间表示、运行时校验、闭环训练与评估。
🔗 原文 / 视频
2. Waymo 的护城河,不只是技术领先,而是穿越 hype cycle 的耐力
Dmitri Dolgov 反复强调,自动驾驶是一个“前 90% 看起来进展飞快,最后 10% 极其漫长”的问题。很多公司能靠 breakthrough 快速起步,但很难把系统做成真正可商用、可扩张、可承担生命安全责任的产品。Waymo 过去二十年的核心资产,某种程度上就是这种长期主义和对安全边界的执着。
🔗 原文 / 视频
3. Anthropic 正在把“跳过审批”重新做成一个安全产品
Anthropic Engineering 发布的 Claude Code auto mode 很有代表性。它不是简单取消权限提示,而是用两层模型化防线替代人工批准:一层检查工具输出里的 prompt injection,另一层在执行前审核 agent 的动作是否越权。这个方向很重要,因为它回答了一个越来越现实的问题:当 agent 越来越能干时,怎么避免 approval fatigue,又不直接滑向危险的 full autonomy。
🔗 原文
📝 官方 Blog
Anthropic Engineering:Claude Code auto mode,用更低摩擦的方式替代手动审批
这篇文章讲清了 Claude Code auto mode 的设计目标:在“每一步都人工 approve”和“--dangerously-skip-permissions 完全放开”之间,做一个更实用的中间层。Anthropic 观察到,人工审批虽然安全,但长期使用会形成 approval fatigue,用户最后往往只是机械点通过。与其假装人工审批永远可靠,不如把真正危险的动作筛出来,把大多数低风险动作自动放行。
它的核心机制有两层。第一层是 prompt-injection probe,在 file read、web fetch、shell output 等工具结果进入 agent 上下文前,先检测其中是否有试图劫持行为的内容。第二层是 transcript classifier,在工具执行前判断动作是否越权、是否会跨越 trust boundary、是否涉及破坏性操作或 data exfiltration。Anthropic 还专门强调,classifier 只看用户消息和工具调用,不看 assistant 自己的解释文本,也尽量不看工具输出,以降低被模型“说服”或被注入内容污染的风险。
最有意思的是它公开了真实取舍。文章给出的 deployed pipeline 指标里,full pipeline 在真实内部流量上的 false positive rate 是 0.4%,但在真实 overeager action 数据集上的 false-negative rate 仍有 17%。Anthropic 没把它包装成“完美自动驾驶式安全系统”,而是非常直白地说:auto mode 明显比完全跳过权限更安全,但它不是高风险基础设施场景下 careful human review 的替代品。这种诚实反而很有价值,因为它把 agent safety 从口号拉回到了工程现实。
一句很值得记住的话是:“Auto mode is meant to replace –dangerously-skip-permissions without bringing back interruptions.” 这几乎点明了未来 agent 产品设计的一个主线 - 不是把人完全拿掉,而是把“该拦什么、不该拦什么”交给更细粒度的系统来判断。
🔗 原文
🎧 Podcast
Training Data:Waymo 的 Dmitri Dolgov,讲清 2000 万次 ride 背后的技术和耐力
The Takeaway: Waymo 的真正壁垒,不是“做出了自动驾驶 demo”,而是把 autonomous driving 这件事从研究问题一路做成了一个可以规模化、可验证、并且持续提升 safety 的产品系统。
Waymo 联合 CEO Dmitri Dolgov 的思路非常清楚。他不是把自动驾驶讲成某个单点模型的胜利,而是讲成一个长期堆系统能力的过程。Waymo 内部的 foundation model 同时服务于 driver、simulator 和 critic 三个核心环节,本质上是一个 multimodal、world-action、language-aligned 的系统。换句话说,它既要理解物理世界和其他交通参与者的行为,也要知道“一个好司机应该怎么做”,还要能被放进真实道路环境中稳定运行。
他对 end-to-end 的判断也很值得 builder 们记住。Dmitri 直接说,Waymo 的 foundation model 本身就是 end-to-end,但“end-to-end vs. 其他方法”是个假问题。真正的问题是:如果你想做到 fully autonomous、superhuman safety、并且跑上数亿英里规模,光有一个 vanilla end-to-end system 远远不够。你还需要结构化中间表示、运行时额外校验、闭环训练、闭环评估,以及能承受现实世界长尾问题的系统工程。
他有一句话很能概括 Waymo 的长期主义:“It’s very easy to get started, but it’s very difficult to take it all the way to a real product, full autonomy, and superhuman performance.” 这句话不只适用于自动驾驶,也很适用于今天的 agent 和 robotics。很多团队能用新模型快速做出惊艳起步,但真正难的是把能力磨成产品,把产品磨成规模,再把规模磨成可靠性。
另一个强信号是 Waymo 已经进入明显的规模拐点。Dolgov 提到,Waymo 已完成超过 20 million fully autonomous rides,其中后 10 million 只用了最近 7 个月。这说明它已经从“技术可行”阶段,开始迈向“商业化加速复制”阶段。对 AI builder 来说,这期内容最大的价值,是提醒大家别把 world model、foundation model、end-to-end 这些词当成 marketing label;真正的胜负,最后还是落在系统设计、验证机制和穿越周期的耐力上。
🔗 收听 / 观看
Generated through the Follow Builders skill: https://github.com/zarazhangrui/follow-builders