AI Builders 日报 — 2026年5月6日

🎙️ 播客精选

Waymo 的 Dmitri Dolgov：自动驾驶不是一把梭的 end-to-end，而是把安全、规模与成本一起做穿

The Takeaway： 自动驾驶真正难的不是“让车能开起来”，而是把 superhuman safety、规模化部署、成本下降 同时做成，而这件事不能只靠一个纯 end-to-end 模型。

Waymo 联合 CEO Dmitri Dolgov 是那种在同一条赛道上连续打了二十年的人。从 DARPA Challenge 到 Google self-driving car project，再到今天 Waymo 已经跑出 20 million rides，他的核心判断很清楚：自动驾驶的问题一直都“很容易入门，但极难把它做成真实产品”。

最值得注意的一点，是他对当下 AI 圈流行的 end-to-end 叙事并不买账。Dolgov 直接说，“the basic vanilla end-to-end system is insufficient.” 如果目标只是做一个 demo，让系统偶尔表现惊艳，纯 end-to-end 当然很诱人；但如果目标是上路、在复杂城市环境里持续运行、还要做到接近甚至超过人类司机的安全水平，那你必须在 learned representation 之外，加上结构化的中间层、验证机制、工程冗余和可规模化的系统设计。

另一条很现实的线索是硬件。Waymo 第六代传感器/硬件平台的重点，不只是性能提升，而是 simplification、drastic cost reduction、high-scale volume production。这其实是在提醒所有 AI builder：模型突破只是上半场，真正能变成产业的，往往是把系统复杂度压下去、把单位成本打下来、把交付链条做稳。

如果把这套思路翻译成今天的软件世界，它和 agent 产品也很像：真正值钱的不是一次炫技，而是把可靠性、可解释性、工作流集成和规模化运营打包成可持续交付的系统。

🔗 原视频：https://www.youtube.com/playlist?list=PLOhHNjZItNnMm5tdW61JpnyxeYH5NDDx8

🐦 X / Builder 观察

Guillermo Rauch：安全审计开始进入 agent 原生时代

Vercel CEO Guillermo Rauch 发布了开源项目 deepsec，定位是一个给深度安全审计用的 agent orchestrator。他给出的判断非常激进：coding agents 已经能在几分钟内发现某些关键漏洞，而传统人工团队可能要花数月，甚至根本看不出来。

这条动态真正重要的地方不只是“又开源了一个工具”，而是安全工作流正在被重新定义。过去安全更像项目末尾的审计环节，现在更像可以持续运行、并入开发流水线的 agent 系统。如果这类工具成熟，未来安全 review 很可能会像 CI 一样常驻，而不是上线前才临时抱佛脚。

🔗 原文：https://x.com/rauchg/status/2051386798899888539

Aaron Levie：enterprise agents 会很快从概念变成 IT 改造工程

Box CEO Aaron Levie 观察到，Anthropic 和 OpenAI 都在推进帮助企业内部落地 AI agents 的新计划。他的重点不是“agent 很酷”，而是这件事一旦开始进入 knowledge work，企业就必须补一整套基础设施：上下文权限、系统集成、工作流重构，以及人和 agent 的协作边界。

换句话说，下一波 enterprise AI 机会未必只在模型层，而是在“把旧 IT 系统改造到 agent 可用”这层。谁能把权限、内容、流程和审计串起来，谁才更接近真正的企业入口。

🔗 原文：https://x.com/levie/status/2051344780328858040

Peter Yang：agent 的三段式演进开始变清楚了

Peter Yang 用一句很简洁的话概括了接下来的路径：“Coding is the first frontier. Knowledge work is the second one. Personal agents are the third.” 这其实是个很有用的框架。

第一阶段，大家先在 coding 场景里验证 agent 的执行能力，因为环境数字化最彻底、反馈回路最短；第二阶段，agent 会进入知识工作，把搜索、整理、写作、分析这些高频脑力活逐步吞掉；第三阶段才是更贴身的 personal agents，真正替用户持续处理上下文、偏好和长期目标。这个排序也提醒我们：别太早迷恋“万能私人助理”，先把高密度、高反馈的工作场景做穿。

🔗 原文：https://x.com/petergyang/status/2051508988936937764

Sam Altman：下一轮交互跃迁，可能来自 voice

Sam Altman 发了一条很短但信息量不小的判断：他对 voice models 的进展“pretty excited”，而且已经能看到用户正在改变他们和 AI 交互的方式。

这条话的潜台词是，AI 交互范式可能又要往前走一步。文本和代码是过去两年的主战场，但一旦语音模型在延迟、自然度、打断处理和上下文保持上真正成熟，很多今天看起来必须“打开一个 app 再输入”的动作，都会转成更持续、更环境化的对话流。

🔗 原文：https://x.com/sama/status/2051464865634742334

Peter Steinberger：QA 正在被“可复现环境 + agent”彻底改写

OpenClaw 的 Peter Steinberger 展示了 ephemeral crabboxes + WebVNC 的新能力：agent 不只是读日志、提 patch，而是能直接拉起可复现环境，完成测试、修复，并把视频结果挂回 PR。

这件事的关键不在远程桌面本身，而在软件交付里的“证据链”开始自动化。以后很多 bug 修复不只是代码 diff，而会附带环境、操作过程、复现实录和验证结果。QA、support 和 engineering 之间那层最费时间的来回传话，正在被 agent-based workflow 压扁。

🔗 原文 1：https://x.com/steipete/status/2051557150040711425

🔗 原文 2：https://x.com/steipete/status/2051485798613111116

Swyx：大模型公司开始进入“收入够大，估值也够大”的新阶段

Swyx 转了一张自己重构的对比图，核心是在看 OpenAI 和 Anthropic 的估值与 ARR 体量。虽然不同公司的 revenue recognition 口径并不完全一致，但这条动态传递出的信号很明确：顶级 foundation model 公司已经不再只是讲故事，它们开始被当作真正有规模收入的巨头来定价。

这会改变整个 AI 创业生态。上游巨头越像基础设施公司，中下游 builder 就越需要回答一个更直接的问题：你是在它们之上建立分发、工作流和行业解决方案，还是只是在模型能力上涨时被顺手碾过。

🔗 原文：https://x.com/swyx/status/2051440392722391180

今日一句

今天最清晰的主线，不是“模型又变强了”，而是 AI 正在从能力演示走向系统化落地：自动驾驶要补系统层，enterprise agents 要补 IT 层，安全审计要补流程层，voice 要改交互层。真正有壁垒的 builder，会越来越像系统设计师，而不只是 prompt magician。

Generated through the Follow Builders skill: https://github.com/zarazhangrui/follow-builders

🎙️ 播客精选#

Waymo 的 Dmitri Dolgov：自动驾驶不是一把梭的 end-to-end，而是把安全、规模与成本一起做穿#

🐦 X / Builder 观察#

Guillermo Rauch：安全审计开始进入 agent 原生时代#

Aaron Levie：enterprise agents 会很快从概念变成 IT 改造工程#

Peter Yang：agent 的三段式演进开始变清楚了#

Sam Altman：下一轮交互跃迁，可能来自 voice#

Peter Steinberger：QA 正在被“可复现环境 + agent”彻底改写#

Swyx：大模型公司开始进入“收入够大，估值也够大”的新阶段#

今日一句#