2026年4月14日对于 AI 辅助开发工具来说是信息量很大的一天:Anthropic 在 Claude Code 中推出例程,使得可以通过规划或 webhook 自动化整个工作流,而无需让电脑保持开机。Google DeepMind 发布 Gemini Robotics-ER 1.6,并借助 Boston Dynamics 开发了新的工业感知能力。Z.ai 以 MIT 许可证开放 GLM-5.1,在 SWE-Bench Pro 上被评为开源模型第一名。GitHub Copilot 增加了三项实用功能:三步解决冲突、US/EU 数据驻留,以及为第三方代理选择模型。
Claude Code 中的例程 — 预览研究(research preview)
4月14日 — Anthropic 以 research preview 形式推出 Claude Code 中的例程。例程是一种只需配置一次的自动化——包含提示词、仓库和连接器——随后即可自主运行,用户无需保持登录状态。
可用三种触发器:
| 类型 | 触发器 | 用例 |
|---|---|---|
| 计划任务 (Scheduled) | Cron(每小时、夜间、每周) | 对 Linear 漏洞进行夜间分类,创建修复 PR |
| API | 向专用端点发起 HTTP POST 调用 | Datadog 告警 → 自动分类 + 修复草案 |
| Webhook | GitHub 事件(PR、push…) | 每次打开 PR 时自动进行代码审查 |
每个例程都有自己的端点和身份验证令牌。API 例程可以接入任何现有流水线(告警、部署钩子、内部工具)。Webhook 例程会为每个符合所定义筛选条件的 PR 启动一个新会话,并将后续更新(评论、持续集成失败)注入该会话。
“Configure a routine once (a prompt, a repo, and your connectors), and it can run on a schedule, from an API call, or in response to an event. Routines run on our web infrastructure, so you don’t have to keep your laptop open.”
🇨🇳 只需配置一次例程(一个提示词、一个仓库和你的连接器),它就可以按计划、通过 API 调用,或在事件触发时运行。例程运行在我们的网页基础设施上,所以无需让你的电脑保持开机。 — @claudeai 在 X 上
可用性与限制:
| 套餐 | 每日例程数 |
|---|---|
| Pro | 5 |
| Max | 15 |
| Team / Enterprise | 25 |
适用于所有付费套餐(Pro、Max、Team、Enterprise),并已启用 Claude Code web。超出配额后,仍可继续使用。例程会像交互式会话一样消耗订阅额度。
已记录的用例:
- 待办事项管理:夜间分类、打标签、Slack 摘要
- 文档漂移(docs drift):每周扫描已合并 PR,发现需要更新的页面
- 部署后验证:每次发布后进行烟雾测试(smoke checks)
- SDK 移植:每次 Python PR 合并后自动移植到 Go SDK
🔗 Anthropic 博客 🔗 公告推文
Claude Code v2.1.105 — PreCompact hooks、插件监视器、/proactive
4月11日至13日 — Claude Code 的 2.1.105 版本带来多项显著改进:
| 功能 | 描述 |
|---|---|
path 参数用于 EnterWorktree | 允许切换到当前仓库中已存在的 worktree |
| PreCompact Hook | Hook 现在可以阻止压缩(退出码 2 或 {"decision":"block"}) |
| 插件的 Background monitors | 插件清单中的 monitors 键——会在会话启动时自动启用 |
/proactive | /loop 的新别名 |
| 放弃被阻塞的 Streams API | 5 分钟无数据后放弃 + 以非流式模式重试 |
| 网络错误消息 | 立即显示重试消息,而不是无声的加载动画 |
| 长文件显示 | 超长的单行写入(例如:压缩后的 JSON)会在界面中被截断 |
改进的 /doctor | 状态图标 + f 键,用于让 Claude 修正检测到的问题 |
4月14日 — 2.1.107 版本带来一项界面改进:在长时间操作期间,进度提示(thinking hints)现在会更早显示,从而减少没有视觉反馈时的等待感。
Anthropic — Vas Narasimhan 加入董事会
4月14日 — Anthropic 的 Long-Term Benefit Trust(LTBT)任命 Vas Narasimhan 加入董事会。作为医师科学家和 Novartis 首席执行官,他曾监督超过 35 种创新药物的开发与审批,所在行业是全球监管最严格的行业之一。
随着这项任命,由 Trust 任命的董事如今已构成董事会多数。LTBT 是一个独立机构,其成员在 Anthropic 中没有任何财务利益——其职责是在商业成功与长期公共利益使命之间维持平衡。
Gemini Robotics-ER 1.6 — 工业感知与安全
4月14日 — Google DeepMind 发布 Gemini Robotics-ER 1.6,这是其机器人领域具身推理(embodied reasoning)模型的更新版本。该模型提升了视觉与空间理解能力,使机器人能够更自主地规划并执行真实任务。它在内部机器人基准上优于 Gemini Robotics-ER 1.5 和 Gemini 3.0 Flash。
新能力:
| 能力 | 描述 |
|---|---|
| 空间指向 (Pointing) | 目标检测与计数、关系逻辑(更小/更大)、轨迹与抓取点、复杂约束 |
| 多视角成功检测 | 分析多个摄像机角度,以验证任务确实完成 |
| 仪表读取 | 读取圆形表盘和透明管道(sight glasses)——与 Boston Dynamics 合作为工业检查而开发 |
| 安全性(ASIMOV v2 基准) | 在所测试模型中,对安全指令遵守方面得分最高 |
仪表读取能力源自与 Boston Dynamics 针对 Spot 机器人的合作,该机器人用于工业设施巡检。它结合空间推理与代码执行,以高精度解释压力表读数。
可用性: Gemini API (gemini-robotics-er-1.6-preview)、Google AI Studio,以及 GitHub Colab 入门笔记本。
GLM-5.1 — Z.ai 以 MIT 许可证开放其智能体模型
4月7日 (补录公告——上周扫描时遗漏) — Z.ai(原 ZhipuAI)发布了 GLM-5.1,其面向智能体式编码(agentic coding)的新旗舰模型,并以 MIT 许可证开源。
代码基准性能:
| 基准 | GLM-5.1 | GLM-5 | Claude Opus 4.6 | GPT-5.4 | Gemini 3.1 Pro |
|---|---|---|---|---|---|
| SWE-Bench Pro | 58,4 | 55,1 | 57,3 | 57,7 | 54,2 |
| NL2Repo | 42,7 | 35,9 | 49,8 | 41,3 | 33,4 |
| Terminal-Bench 2.0 | 63,5 | 56,2 | 65,4 | — | 68,5 |
GLM-5.1 在 SWE-Bench Pro、Terminal-Bench 和 NL2Repo 上排名 开源第一 和 全球第三。
关键差异:长时间跨度。 早期模型,包括 GLM-5,往往先快速提升性能,然后进入平台期。GLM-5.1 旨在在更长时间跨度的智能体任务中保持高效:它可以自主工作长达 8 小时,并在数千次工具调用中不断优化策略。
三个场景展示了这一能力:
- 600 次迭代的向量数据库优化:GLM-5.1 在 VectorDBBench 上达到每秒 21,500 次请求,是单次 50 轮会话所取得最佳结果的 6 倍。
- 1,000+ 轮的 GPU 内核优化:在 KernelBench 第 3 级上实现 3.6 倍加速。
- 8 小时构建 Linux 桌面:仅凭一条自然语言提示,GLM-5.1 就能在浏览器中生成完整桌面环境(文件管理器、终端、编辑器、系统监视器)。
可用性: HuggingFace 上的开源权重(zai-org/GLM-5.1)、api.z.ai 和 BigModel.cn 上的 API,兼容 Claude Code、Cline、Roo Code、Kilo Code 和 OpenCode。
🔗 GLM-5.1 博客 🔗 公告推文
Codex CLI v0.120.0 — 智能体实时流式传输
4月11日 — 0.120.0 版本的 Codex CLI 作为稳定版发布。它带来多项功能改进:
| 功能 | 详情 |
|---|---|
| Realtime V2 | 实时流式传输后台智能体的进度,并将后续响应排队 |
| 改进的 TUI hooks | 活跃的 hooks 单独显示,已完成 hooks 的历史记录更精简 |
| 状态中的线程标题 | 自定义 TUI 状态可以包含已重命名线程的标题 |
| code-mode 输出模式 | code-mode 工具声明现在包含 outputSchema MCP 详细信息 |
| SessionStart hooks | 区分由 /clear 创建的会话与启动或恢复 |
该版本还包含多项错误修复:提升 Windows sandbox 的处理、修复 WebSocket TLS 连接时的 panic、保持工具搜索结果的顺序。
GitHub Copilot — 三项新功能
为第三方代理选择模型
4月14日 — 现在可以在 github.com 上启动使用 Claude(Anthropic)和 Codex(OpenAI)代理的任务时选择模型。
| 代理 | 可用模型 |
|---|---|
| Claude | Claude Sonnet 4.6, Claude Opus 4.6, Claude Sonnet 4.5, Claude Opus 4.5 |
| Codex | GPT-5.2-Codex, GPT-5.3-Codex, GPT-5.4 |
包含在现有的 Copilot 订阅(Business 或 Enterprise)中,但管理员必须在企业或组织级别启用相应策略。
🔗 模型选择更新日志
三步解决 merge 冲突
4月13日 — 在存在 merge 冲突的 pull request 上会出现一个新的 “Fix with Copilot” 按钮。只需三步,Copilot cloud agent 就能解决冲突、检查 build 和测试是否通过,然后从其隔离的云环境中推送。PR 中的 @copilot 也可用于修复失败的 GitHub Actions 工作流,或处理代码审查评论。适用于所有付费 Copilot 套餐。
US/EU 数据驻留与 FedRAMP 合规
4月13日 — GitHub Copilot 现已支持 US 和 EU 地区的数据驻留:所有推理及相关数据都保留在指定地理区域内。美国政府客户还可获得 FedRAMP Moderate 合规支持。data-resident 请求的 premium requests 乘数会加收 10%。Gemini 模型尚不受支持(GCP 目前还不提供具备数据驻留的推理端点)。日本和澳大利亚已列入 2026 年路线图。
🔗 数据驻留更新日志
生成式媒体 — Runway、Luma、MiniMax、ElevenLabs
视频通话中的 Runway Characters
4月14日 — Runway 推出 Characters 更新,允许将你的 AI 头像发送到 Zoom、Google Meet 或 Teams 视频通话中。流程如下:选择或创建一个 Character → 粘贴会议链接 → 点击 “Join Meeting”。该功能最初自 3 月 9 日起以开发者 API 形式提供,如今已可通过 Runway 应用向所有用户开放。
Luma — 语音听写和标志动画
4月14日 — Luma Labs 推出两项新功能:应用中的语音听写(用户说话,描述会被转换为生成提示词)以及电影感标志动画(上传自己的标志,代理会生成一个面向品牌的动画开场)。
MiniMax — 面向代理的三个开源 Music Skills
4月14日 — MiniMax 开源了三个面向代理的 Music Skills:minimax-music-gen(根据提示词生成完整曲目,并自动在原创、纯音乐和翻唱之间选择)、buddy-sings(AI 代理作为语音伙伴进行歌唱),以及 Playlist curation(从用户的资料库中策划播放列表)。这些组件旨在集成到 M2.7 代理中。
ElevenLabs — 2026 年第一季度 1 亿美元净经常性收入
4月13日 — CEO Mati Staniszewski 宣布,ElevenLabs 在 2026 年第一季度新增超过 1 亿美元的年净经常性收入,创下迄今最佳季度。增长主要由企业合作推动(Klarna、Revolut、Deutsche Telekom、Toyota)。
这意味着什么
Claude Code 中的 routines 代表着一种范式转变:开发工具不再只是响应交互式请求,它现在还可以在项目基础设施中采取计划性或响应性的行动。scheduled + webhook 的组合将 Claude Code 变成了仓库上的常驻代理,而且配置成本极低。
在开源领域,GLM-5.1 证明,中国的代理型模型已经在编码基准上达到最优秀专有模型的水平。能够维持 8 小时的自主工作时长——并进行成千上万次工具调用——为那些传统模型无法在单次会话中处理的高强度优化任务打开了现实可行的可能性。
Gemini Robotics-ER 1.6 展示了另一种趋势:将通用 AI 模型适配到真实世界的物理约束中,并通过软件与硬件(Boston Dynamics/Spot)协作产生新的能力,例如读取工业仪表。
来源
- Anthropic 博客 — Claude Code Routines
- 推文 @claudeai — Routines
- Claude Code 更新日志
- Anthropic — Vas Narasimhan 任命
- Google DeepMind 博客 — Gemini Robotics-ER 1.6
- 推文 @GoogleDeepMind — Gemini Robotics-ER 1.6
- Z.ai 博客 — GLM-5.1
- 推文 @Zai_org — GLM-5.1
- Codex CLI v0.120.0 发布
- GitHub 更新日志 — 第三方代理的模型选择
- GitHub 更新日志 — Copilot 合并冲突
- GitHub 更新日志 — 美国/欧盟 FedRAMP 数据驻留
- 推文 @runwayml — 视频通话角色
- 推文 @LumaLabsAI — 语音听写
- 推文 @LumaLabsAI — 标志动画
- 推文 @MiniMax_AI — Music Skills
- ElevenLabs CEO 推文 — 1 亿美元 ARR
本文档已使用 gpt-5.4-mini 模型从 fr 版本翻译为 zh 语言。有关翻译流程的更多信息,请参阅 https://github.com/jls42/ai-powered-markdown-translator