🔥 今日高光

1. Codex 开始进入 mobile,agent 入口不再只属于桌面端

Sam Altman 直接放出一句很短但信号很强的更新:Codex in the ChatGPT mobile app。这件事的意义不只是“手机上也能点一下 Codex”,而是 agent 正在从 power user 的桌面工作台,变成更日常、更高频的入口。谁先把 agent 带到用户最常打开的入口,谁就更有机会把使用习惯做成默认值。

🔗 原文

2. Dan Shipper:企业会不会真正吃下 agent,先看高管自己有没有天天在用

Dan Shipper 的判断很直接:一个组织会不会变得 agent-pilled,领先指标不是培训课、不是战略 PPT,而是 leadership team 是否真的每天用 Codex、Claude Code、Cowork 这类工具。意思很明确:如果决策层自己没有被 workflow 改写,所谓 AI 转型大概率只是口号。

🔗 原文

3. Nikunj Kothari:未来 agent 的使用规模会比人类大得多,系统不 headless 就会掉队

Nikunj Kothari 这条很像一句产品架构层面的警告:大公司如果还把系统主要设计给 human 使用,而不是给 agent 调用,那么价值会被迅速稀释。他的核心观点是,agent 的市场和调用量可能比 human 大两个数量级,所以真正该优化的对象,正在从“人如何点击界面”变成“agent 如何无摩擦接入系统”。

🔗 原文

4. Voice AI 又开始卷 benchmark,Gradium 想把 TTS 排名重新洗一遍

Matt Turck 转发了 GradiumAI 的成绩单,措辞非常高调:一家成立还不到 9 个月的公司,在第三方 TTS benchmark 上已经超过 OpenAI、ElevenLabs、Cartesia、Deepgram。先不急着把 benchmark 当最终结果,但它至少说明一件事:voice AI 远没到格局稳定的时候,新玩家还有机会靠模型质量和速度冲出头部。

🔗 原文

5. Aaron Levie:AI 会先打乱岗位边界,但最后反而会把专业分工推向更高杠杆

Aaron Levie 这条很成熟。他不否认 AI 让 PM、工程、GTM 等角色开始互相越界,但他认为这种“边界模糊”更像过渡期现象。长期看,specialist 不会消失,反而会因为 AI 工具链而变得更高杠杆。换句话说,AI 不是简单地消灭分工,而是在重写高水平专业能力的定义。

🔗 原文

🐦 Builder 动态

Sam Altman:Codex 不再只是一个桌面能力,而是在往通用入口迁移

Sam Altman 这次发言虽然极短,但含金量不低。把 Codex 放进 ChatGPT mobile app,说明 OpenAI 正在把 agent/coding 能力从相对垂直的使用场景,推进到更日常的主产品分发面。真正值得关注的不是“手机里能不能写代码”,而是用户会不会因此更频繁地把复杂任务直接交给 agent。

如果这个入口跑通,未来很多 agent 行为就不会从 IDE 或 desktop app 开始,而是先从用户最熟悉的聊天入口发起,再流向更深层的执行环境。这会改变很多产品对“首触点”的判断。

🔗 原文

Dan Shipper:AI adoption 的瓶颈往往不在员工,而在领导层是否亲自改掉自己的工作流

Dan Shipper 最近的观察很值得抄在墙上:一家公司的高管团队如果没有亲手使用 Codex、Claude Code 或 Cowork,那么这家公司大概率还没真正进入 agent-native 状态。很多组织的问题不是买不到工具,而是最有权力重构流程的人还停留在旁观模式。

他后面那句“2026 is wild”也不是玩笑。一个理发师已经在用 Claude 跑 crypto trading strategy,旁边的人所在公司一次性买了 1,300 个 Claude 席位,这种 consumer 侧与 enterprise 侧同时升温的画面,说明 agent adoption 已经开始跨出技术圈小圈层。

🔗 高管 adoption 观点

🔗 使用场景扩散观察

Nikunj Kothari:系统如果只为 human 设计,就会在 agent 时代被边缘化

Nikunj Kothari 的核心判断非常适合所有做 enterprise software 和 infra 的人反复看一遍:未来 agent 的调用规模可能是人类使用规模的 100 倍,因此系统架构如果仍然主要围绕 human UI 搭建,就会天然卡住价值增长。这里的关键词不是 API 而已,而是 headless:系统必须能够被程序化访问、编排、调用和授权。

这条的真正厉害之处在于,它把 agent 时代的产品问题从“加不加 AI 功能”提升到了“你的系统是不是 agent-ready”。前者只是 feature,后者是生存条件。

🔗 原文

Matt Turck:voice AI 赛道还在剧烈洗牌,benchmark 战争远未结束

Matt Turck 转发 GradiumAI 时,几乎是在用 VC 式的警报语气宣告一件事:voice AI 的头部格局还没定。一个只有 9 个月历史的团队,已经敢公开宣称在第三方 TTS benchmark 上全面压过 OpenAI、ElevenLabs、Cartesia、Deepgram,这说明两件事同时成立:一是语音模型能力还在快速迭代;二是市场认知对“谁是默认赢家”并不稳。

对 builder 来说,启发不是立刻下注哪家公司,而是别太早把 voice 层看成已经结束竞争。只要 latency、自然度、可控性、成本结构里还有任一项能被明显拉开,新进入者就仍然有机会。

🔗 原文

🎧 Podcast

The MAD Podcast with Matt Turck:Ivan Burazin 解释了,为什么每个 agent 最终都需要一台“自己的电脑”

The Takeaway: 如果你把 agent 当成真正的 digital knowledge worker,而不是一次性调用模型的脚本,那么它迟早需要一台属于自己的可控计算环境,也就是 sandbox。

Daytona CEO Ivan Burazin 的观点非常鲜明:agent 之所以需要“自己的电脑”,不是为了炫技,而是因为只要任务开始涉及登录系统、访问网页、安装工具、运行脚本、处理 2FA、管理状态,你就已经不再是在调用一个纯文本模型,而是在雇一个数字员工。既然是数字员工,就不能直接把它放进你自己的主力电脑和主账号里裸奔。更合理的做法,是给它隔离环境、独立账号、受限权限,必要时甚至给它单独的手机号和支付额度。

他最值得记住的一句原话是:“When I think about agents, I think of them as digital knowledge workers.” 顺着这个视角,sandbox 的定义也变得很清楚:它不是一个抽象的安全容器,而是一台 agent 可组合、可安装、可联网、可执行任务的 computer。Ivan 还进一步指出,今天很多 hyperscaler 的基础架构是为 stateless app 设计的,而 agent 天生更接近 stateful worker,这意味着 agent infra 不是简单复用旧云架构就能解决的问题。

这期内容对所有做 agent infra、browser automation、computer use、enterprise agent 的 builder 都有启发:真正的难点不是让模型“会说”,而是让它在受控边界里“能做事、持续做事、出错了还能立刻被杀掉”。

🔗 收听 / 观看


本日报仅基于 follow-builders feed 中可确认的 X 与 podcast 数据 remix 生成;未确认的信息未写入。Generated through the Follow Builders skill: https://github.com/zarazhangrui/follow-builders