AI 周报 — 2026年4月4日 ~ 4月10日

🔥 本周热点

1. Anthropic 发布 Claude Mythos —— “太强大而不能公开发布”

Anthropic 宣布其最新模型 Claude Mythos Preview,声称在网络安全领域具有突破性能力,能自主发现并修补关键软件漏洞。但因安全风险过高,Anthropic 拒绝向公众发布,改为仅向包括 Apple、Amazon、Microsoft 在内的 40+ 家科技公司组成的联盟提供受限访问,用于关键基础设施安全审计。CNN 称其为"令人恐惧的警告信号"。

🔗 纽约时报报道 · NBC News

2. 智谱 GLM-5.1 开源,编码基准登顶

智谱 AI 开源 GLM-5.1(744B MoE,MIT 许可),在 SWE-Bench Pro 编码基准上超越 GPT-5.4,成为当前最强开源编码模型。同时发布多模态编码模型 GLM-5V-Turbo

🔗 WhatLLM 详细分析

3. CoreWeave 与 Meta 签下 210 亿美元 AI 算力协议

CoreWeave 与 Meta 达成价值 210 亿美元的 AI 计算基础设施合作,Meta 同时在路易斯安那州为超大型数据中心建设燃气发电厂。AI 算力需求持续爆发。

🔗 Bloomberg Technology

4. OpenAI 估值突破 8500 亿美元

OpenAI 在最新一轮融资后估值达到 $850B,同时积极推动 AI 政策制定,警告"华盛顿还没准备好"。

🔗 Bloomberg Technology · Axios 报道

5. Claude Code 源代码意外泄露

3 月 31 日 Anthropic 意外发布了 Claude Code CLI 的完整源代码,51.2 万行 TypeScript。社区对其内部架构进行了全面分析。

🔗 AIFOD 分析


🛠️ 新工具 / 产品发布

  1. Google Gemma 4 家族 — 四个变体(E2B / E4B / 26B MoE / 31B Dense),Apache 2.0 开源,多模态支持 🔗 Google Blog

  2. Microsoft MAI 基础模型 — 三款全新模型覆盖语音转录、音频生成和图像生成 🔗 TechCrunch

  3. 阿里 Qwen 3.6-Plus — 面向 Agentic 编码场景,支持 100 万 token 上下文 🔗 WhatLLM

  4. PrismML Bonsai 8B — 1-bit 量化模型,极致压缩率 🔗 WhatLLM

  5. vLLM 0.19.0 — 集成 Hugging Face、零气泡异步调度、支持 Gemma 4 架构 🔗 AIFOD

  6. Atlassian Confluence AI — Rovo Remix 视觉 AI 工具 + 第三方 Agent 集成 🔗 TechCrunch

  7. JetBrains Air (Public Preview) — 专用 Agentic 开发环境,支持 Claude Agent、Codex、Gemini、Junie 并发运行 🔗 JetBrains Blog

  8. Google Colab Learn Mode — 个人编码导师功能 🔗 Google Blog

  9. Vanguard Expert Insights — AI 驱动的投资组合分析工具 🔗 Wealth Management


📊 模型更新

模型动态
Claude Opus 4.6继续稳坐 S 级宝座,编码准确率最高
Claude Sonnet 4.6新默认免费模型,1M context beta,GDPval-AA Elo 领先全场(1633)
Qwen 3.5升至 A 级,成为付费模型的可行免费替代
GPT-5.4 Pro保持 S 级,但编码方面被 GLM-5.1 超越
Gemini 3.1 ProA 级,稳定表现
Grok 4.20A 级新晋

🔗 完整排名对比


💡 值得关注的趋势

  • Claude Code 称霸开发者工具:The Pragmatic Engineer 调查显示 Claude Code 仅发布 8 个月即超越 GitHub Copilot 和 Cursor 成为 #1 AI 编码工具。Staff+ 工程师是 AI Agent 最大用户群 🔗 Pragmatic Engineer

  • 开源模型进入 Frontier 竞争:GLM-5.1(MIT)、Gemma 4(Apache 2.0)、Mistral Small 4 让任何有 GPU 的团队无需 API 即可运行前沿级模型

  • AI Agent 从实验走向生产:2026 年最大范式转移——应用正从交互式工具进化为自主系统。Agentic workflow 成为主流话题 🔗 Medium

  • Intel 加入 Musk Terafab 项目:Intel 与 Tesla、SpaceX、xAI 联手,AI 芯片制造版图重组 🔗 Bloomberg

  • AI 安全治理差距加大:Anthropic Mythos 事件凸显模型能力已超越监管框架,“技术跑得比治理快"成为行业共识 🔗 Substack