🔥 今日高光

Anthropic 发布 Claude Mythos Preview

Alex Albert(Anthropic)连发多条推文宣布新模型 Claude Mythos Preview,称其为 “Project Glasswing” 的一部分,是他加入 Anthropic 近三年来最具影响力的事件。Box CEO Aaron Levie 评价称,Mythos 再次证明模型能力进步没有任何瓶颈,关键 benchmark 上出现了两位数的显著提升。

Sam Altman:Codex 周活突破 300 万,重置用量限制

OpenAI CEO Sam Altman 宣布 Codex 周活跃用户达到 300 万,为此重置所有用户的使用限制,并承诺每增长 100 万用户(直到 1000 万)都会再次重置。

OpenAI Prism 推出 Paper Review 功能

Kevin Weil(OpenAI)介绍了 Prism 平台新上线的 Paper Review 工具,能像专业技术审稿人一样检查论文中的数学推导、符号、单位、结构等问题,而非简单的语法检查。该功能由 Codex 驱动,仅用几小时便完成开发。


🐦 Builder 动态

Garry Tan(YC) 感慨我们正处于 “LISP 时代”——代码即数据、数据即代码,只不过这次的载体是 Markdown。他还吐槽 Claude Code 的沙箱限制可以被 cat >> 绕过。

Guillermo Rauch(Vercel) 在 YC 演讲后表示比以往更加看好 AI 创业——最好的城市、最好的时代、几代人一遇的机会。

Peter Yang 关注到 Anthropic 内部是否在使用 Mythos 来推动近期的疯狂发布节奏。

Aaron Levie 认为 AI agents 带来的生产力提升即将从编程领域扩展到所有知识工作——从聊天机器人到真正能处理复杂工作流的 agent。

Zara Zhang 发布了 Personalized Podcast Skill,可以把任意内容变成双 AI 主播的播客,通过 RSS 订阅在播客 App 中收听。

Steipete 发布 CodexBar 0.20,新增 Perplexity + OpenCode Go 支持,修复 Claude token 计费重复问题。

Swyx 分享了 Simon Willison 关于 “prompt injection” 与 “lethal trifecta” 命名差异的讨论,以及亚马逊的新动作。

Cat Wu(Anthropic) 推荐 Claude Code CLI 的 /powerup 命令来学习团队最爱的功能。

Aditya Agarwal 感慨 Mythos 模型 “太离谱了”,并将当前时代类比 2009 年 Web 2.0 的读写革命——所有软件都可以被 fork 和重构。


🎙️ 播客精选

Latent Space:极限 Harness Engineering —— Ryan Lopopolo, OpenAI

本期邀请 OpenAI 的 Ryan Lopopolo 深入探讨大规模 AI 工程实践:100 万行代码、每天 10 亿 token、0% 人工编写、0% 人工审查。核心观点:

  • 将产品需求"坍缩"为代码问题,就能自然地用 Codex harness 来解决
  • 需要系统思维:不断追问 agent 哪里出错、时间花在哪里
  • 对自动化建立信心,逐步放手让 agent 接管

🔗 Latent Space 频道


本日报由 AI Builders Digest 自动生成,数据来源:X / YouTube