🎙️ 播客精选

Waymo 的 Dmitri Dolgov:自动驾驶不是一把梭的 end-to-end,而是把安全、规模与成本一起做穿

The Takeaway: 自动驾驶真正难的不是“让车能开起来”,而是把 superhuman safety、规模化部署、成本下降 同时做成,而这件事不能只靠一个纯 end-to-end 模型。

Waymo 联合 CEO Dmitri Dolgov 是那种在同一条赛道上连续打了二十年的人。从 DARPA Challenge 到 Google self-driving car project,再到今天 Waymo 已经跑出 20 million rides,他的核心判断很清楚:自动驾驶的问题一直都“很容易入门,但极难把它做成真实产品”。

最值得注意的一点,是他对当下 AI 圈流行的 end-to-end 叙事并不买账。Dolgov 直接说,“the basic vanilla end-to-end system is insufficient.” 如果目标只是做一个 demo,让系统偶尔表现惊艳,纯 end-to-end 当然很诱人;但如果目标是上路、在复杂城市环境里持续运行、还要做到接近甚至超过人类司机的安全水平,那你必须在 learned representation 之外,加上结构化的中间层、验证机制、工程冗余和可规模化的系统设计。

另一条很现实的线索是硬件。Waymo 第六代传感器/硬件平台的重点,不只是性能提升,而是 simplification、drastic cost reduction、high-scale volume production。这其实是在提醒所有 AI builder:模型突破只是上半场,真正能变成产业的,往往是把系统复杂度压下去、把单位成本打下来、把交付链条做稳。

如果把这套思路翻译成今天的软件世界,它和 agent 产品也很像:真正值钱的不是一次炫技,而是把可靠性、可解释性、工作流集成和规模化运营打包成可持续交付的系统。

🔗 原视频:https://www.youtube.com/playlist?list=PLOhHNjZItNnMm5tdW61JpnyxeYH5NDDx8


🐦 X / Builder 观察

Guillermo Rauch:安全审计开始进入 agent 原生时代

Vercel CEO Guillermo Rauch 发布了开源项目 deepsec,定位是一个给深度安全审计用的 agent orchestrator。他给出的判断非常激进:coding agents 已经能在几分钟内发现某些关键漏洞,而传统人工团队可能要花数月,甚至根本看不出来。

这条动态真正重要的地方不只是“又开源了一个工具”,而是安全工作流正在被重新定义。过去安全更像项目末尾的审计环节,现在更像可以持续运行、并入开发流水线的 agent 系统。如果这类工具成熟,未来安全 review 很可能会像 CI 一样常驻,而不是上线前才临时抱佛脚。

🔗 原文:https://x.com/rauchg/status/2051386798899888539

Aaron Levie:enterprise agents 会很快从概念变成 IT 改造工程

Box CEO Aaron Levie 观察到,Anthropic 和 OpenAI 都在推进帮助企业内部落地 AI agents 的新计划。他的重点不是“agent 很酷”,而是这件事一旦开始进入 knowledge work,企业就必须补一整套基础设施:上下文权限、系统集成、工作流重构,以及人和 agent 的协作边界。

换句话说,下一波 enterprise AI 机会未必只在模型层,而是在“把旧 IT 系统改造到 agent 可用”这层。谁能把权限、内容、流程和审计串起来,谁才更接近真正的企业入口。

🔗 原文:https://x.com/levie/status/2051344780328858040

Peter Yang:agent 的三段式演进开始变清楚了

Peter Yang 用一句很简洁的话概括了接下来的路径:“Coding is the first frontier. Knowledge work is the second one. Personal agents are the third.” 这其实是个很有用的框架。

第一阶段,大家先在 coding 场景里验证 agent 的执行能力,因为环境数字化最彻底、反馈回路最短;第二阶段,agent 会进入知识工作,把搜索、整理、写作、分析这些高频脑力活逐步吞掉;第三阶段才是更贴身的 personal agents,真正替用户持续处理上下文、偏好和长期目标。这个排序也提醒我们:别太早迷恋“万能私人助理”,先把高密度、高反馈的工作场景做穿。

🔗 原文:https://x.com/petergyang/status/2051508988936937764

Sam Altman:下一轮交互跃迁,可能来自 voice

Sam Altman 发了一条很短但信息量不小的判断:他对 voice models 的进展“pretty excited”,而且已经能看到用户正在改变他们和 AI 交互的方式。

这条话的潜台词是,AI 交互范式可能又要往前走一步。文本和代码是过去两年的主战场,但一旦语音模型在延迟、自然度、打断处理和上下文保持上真正成熟,很多今天看起来必须“打开一个 app 再输入”的动作,都会转成更持续、更环境化的对话流。

🔗 原文:https://x.com/sama/status/2051464865634742334

Peter Steinberger:QA 正在被“可复现环境 + agent”彻底改写

OpenClaw 的 Peter Steinberger 展示了 ephemeral crabboxes + WebVNC 的新能力:agent 不只是读日志、提 patch,而是能直接拉起可复现环境,完成测试、修复,并把视频结果挂回 PR。

这件事的关键不在远程桌面本身,而在软件交付里的“证据链”开始自动化。以后很多 bug 修复不只是代码 diff,而会附带环境、操作过程、复现实录和验证结果。QA、support 和 engineering 之间那层最费时间的来回传话,正在被 agent-based workflow 压扁。

🔗 原文 1:https://x.com/steipete/status/2051557150040711425

🔗 原文 2:https://x.com/steipete/status/2051485798613111116

Swyx:大模型公司开始进入“收入够大,估值也够大”的新阶段

Swyx 转了一张自己重构的对比图,核心是在看 OpenAIAnthropic 的估值与 ARR 体量。虽然不同公司的 revenue recognition 口径并不完全一致,但这条动态传递出的信号很明确:顶级 foundation model 公司已经不再只是讲故事,它们开始被当作真正有规模收入的巨头来定价。

这会改变整个 AI 创业生态。上游巨头越像基础设施公司,中下游 builder 就越需要回答一个更直接的问题:你是在它们之上建立分发、工作流和行业解决方案,还是只是在模型能力上涨时被顺手碾过。

🔗 原文:https://x.com/swyx/status/2051440392722391180


今日一句

今天最清晰的主线,不是“模型又变强了”,而是 AI 正在从能力演示走向系统化落地:自动驾驶要补系统层,enterprise agents 要补 IT 层,安全审计要补流程层,voice 要改交互层。真正有壁垒的 builder,会越来越像系统设计师,而不只是 prompt magician。

Generated through the Follow Builders skill: https://github.com/zarazhangrui/follow-builders