🔥 今日高光
Claude Code 开始接入更具体的现实工作流。 Thariq 提到 Claude Code 现在已经有 TurboTax connector,这不是玩具式 demo,而是把 agent 往真实个人事务和垂直软件流程里推进了一步。对 builder 来说,重点不是“能不能接 API”,而是 agent 能否进入有上下文、有状态、低容错的业务链路。
🔗 原文OpenClaw 在继续把“agent 不中途偷懒”产品化。 Peter Steinberger 连发多条更新,核心方向很清楚:用 strict-agentic 执行契约逼模型继续读代码、继续调工具、继续改动,而不是停在“我已经给你一个计划了”。这实际上是在解决 agent 落地里最烦人的一类问题:长任务半途退出。
🔗 strict mode · Codex harness · plugin harness基础设施层开始公开争夺“agent runtime”心智。 Guillermo Rauch 宣布 Vercel Sandbox 成为最快的 microVM-based sandbox,并直接点名 coding agents、并行 compute、Claw 这类场景。潜台词很明显:未来竞争不只是谁的模型强,而是谁能提供更稳、更快、更可扩展的 agent execution substrate。
🔗 原文Token demand 可能被严重低估。 Aaron Levie 认为现在大多数 AI 使用还停留在 token 效率相对高的 chat tools,但 coding agents 已经呈现出数量级更高的 token 消耗;一旦这种模式扩散到全部 knowledge work,数据中心与算力需求会继续“垂直起飞”。这对 AI infra、cloud capex、模型定价都会产生连锁影响。
🔗 原文Agent 基础设施的讨论正在变“更工程化”。 从 connector、strict mode、sandbox 到 long-horizon memory,今天 builder 们讨论的重点不再是抽象愿景,而是 agent 怎样真正跑得久、跑得稳、接得上真实系统。
🔗 Aditya Agarwal:long-horizon memory
🐦 Builder 动态
Thariq(Anthropic)— Claude Code 正在进入真实软件连接器时代
Thariq 提到 Claude Code 现在已有 TurboTax connector。这条推文的信息量其实不小:AI coding agent 正在从“帮你写代码”转向“帮你完成具体业务任务”,而 connector 正是让 agent 进入真实 SaaS 工作流的关键入口。接下来值得关注的不是 connector 数量,而是这些连接器是否能承载更复杂的状态管理、权限边界和审计需求。
🔗 原文
Peter Steinberger(OpenClaw)— strict mode、Codex harness、可插拔 harness 三连发
Peter 今天这组三连基本勾勒出了 OpenClaw 的一个产品方向:
- 用 strict-agentic execution contract 约束 GPT-5.x 持续推进任务
- 提供 native Codex 作为 harness,让 thread、resume、compaction、app-server execution 交给 Codex 接管
- 进一步把 harness 做成 plugin,方便替换 Anthropic SDK 或其他自定义实现
这背后不是单点功能更新,而是在回答一个更大的问题:agent 的“人格层”和“执行层”到底该怎么拆? 如果拆得够清楚,agent 才能既保留个性,又持续提升执行能力。
🔗 strict mode
🔗 Codex harness
🔗 plugin harness
Guillermo Rauch(Vercel)— Sandbox 正在成为 agent 基础设施战场
Rauch 宣布 Vercel Sandbox 现在是最快的 microVM-based sandbox,并强调真实世界里的性能与可靠性同样领先。他特意把使用场景写成“claws、coding agents、plain compute parallelism”,说明 Vercel 不是把 sandbox 当成配角,而是把它视为新一代应用和 agent runtime 的底座。
如果这个判断成立,那么未来开发者栈会继续下沉:从“我用哪个 model”变成“我的 agent 运行在哪个 execution fabric 上”。
🔗 原文
Aaron Levie(Box)— agent token 消耗会把数据中心需求继续推高
Levie 用一张 capex 图指出,Amazon 最近三年的数据中心投入已经超过此前整个历史总和。他的判断是:今天多数 AI adoption 仍主要来自 chat tools,但 coding agents 的 token 消耗是数量级更高的;一旦更多 knowledge work 进入 agent 工作流,token demand 可能会比行业当前预期高出数百倍。
这条判断很重要,因为它把“agent 更有用”直接转译成了“基础设施账单会更夸张”。对 infra 创业者来说,这不是背景噪音,而是主线。
🔗 原文
Aaron Levie(Box)— AI 不一定减少律师,可能反而增加
Levie 另一条推文也值得记一笔:他认为 AI 会让更多人提出法律问题、制造更多需要审阅的新条款、并催生围绕 AI 本身的新法律领域,因此 律师数量未必会下降,反而可能增加。这是一种典型的“效率提高 → 需求扩张”的判断,对许多白领职业都可能成立。
🔗 原文
Garry Tan — 薄 harness、厚 skills
Garry Tan 给出了一个很 builder 的框架:Thin harness, fat skills。他接着补了一句更有传播性的表达:如果你的 memory 会随着 harness 一起死掉,说明 harness 做得太厚了;真正应该长期保存的是 markdown 里的 memory、skills 和 git repo 里的 brain。
这套表达抓住了 agent 产品设计里的一个关键 tension:什么该做成 runtime,什么该落到可迁移、可审计、可版本化的文本和仓库里。
🔗 薄 harness, 厚 skills
🔗 memory is markdown
Zara Zhang — 人类沟通将更多回到“定方向”和“做陪伴”
Zara 今天两条推文连起来看很完整:
- 最有效的人类协作方式,可能是 不要过度协作,而是由一个人 end-to-end owner,再配合 agents 执行
- 未来人类沟通会更多用于 决定做什么、定义什么是 good、陪伴彼此、做 creative brainstorming,而不是项目同步、状态汇报、交接说明
这其实是在重写团队协作分工:日常“同步成本”会被 agent 吃掉,而真正留给人的,是 judgment、taste 和关系。
🔗 one person owns end-to-end
🔗 human communication 的新分工
Aditya Agarwal — 真正的 agent,关键在 long-horizon memory management
Aditya 认为,真正的“agent”和“让 LLM loop 起来”之间最大的差异,在于 intelligent long-horizon memory management。他特别点名 Claude Code 的三层 memory architecture,认为那才是最值得研究的部分。
这条判断很准:今天很多 agent demo 失败,不是因为单步能力不够,而是因为任务一拉长,状态、记忆和优先级管理立刻崩掉。
🔗 原文
Peter Yang — Figma CEO 对谈预告:AI 时代的 design taste
Peter Yang 预告了与 Figma CEO Dylan 的对谈,话题包括:AI 能否学会 design taste、design systems 会不会束缚创造力,以及 Figma 如何在 AI 时代竞争。虽然还是预告,但这个题目本身就值得盯:下一阶段设计工具的竞争,未必只是“谁会生成 UI”,而是“谁更懂 taste、team workflow 与审美判断”。
🔗 原文
📄 论文速递
今天 follow-builders feed 未包含新的论文条目,本期不单独展开。若只看今日 builder 讨论,memory architecture、agent runtime、programmable payments 仍然是最值得继续追的三条线。
🛠️ 新工具 / 项目
OpenClaw strict-agentic execution contract
如果 strict mode 后续稳定,它可能会成为 agent 产品里的一个重要默认能力:不要只会计划,要持续执行直到遇到真实 blocker。
🔗 原文
Vercel Sandbox
Sandbox 这类 microVM 执行环境,正在从“底层实现细节”升级为 agent 体验的一部分。对 builder 来说,这意味着 sandbox 的冷启动、隔离性、可靠性和并行能力,会直接影响最终产品竞争力。
🔗 原文
🇨🇳 中文圈
今天这批 follow-builders 数据里没有明显的中文圈独立事件,但有两点对国内 builder 同样适用:
- thin harness, fat skills 很适合做私有化、本地化 agent 产品架构
- agent + payments / settlement 这条线,未来在跨境、电商、自动化运营场景里很可能会重新出现
🎧 Podcast
今天 follow-builders feed 检出 1 集新 Podcast,但 feed 当前只提供 频道主页,未提供该期节目的具体公开链接。按发布规则,为避免误链,本期暂不单独收录播客摘要。
今日观察
如果把今天这些 builder 的讨论放在一起看,会发现一个很清晰的共识:
- agent 需要更强的 execution contract,不能停在“给你个计划”
- agent 需要更好的 memory architecture,否则长任务必崩
- agent 需要更稳的 sandbox / runtime,否则工程体验会断层
- agent 需要更具体的 connectors,否则接不上真实世界工作流
这意味着 2026 年 agent 赛道最值得追的,已经不是单纯的 model leaderboard,而是整套 runtime + memory + tool + connector 组合拳。
本日报基于 follow-builders feed 中的 X 推文与 Podcast 数据 remix 生成。所有条目均附原始来源链接;未能确认的内容未写入。