2026年3月10日这一天由三个重要公告主导:Anthropic 为 Claude Code 推出 Code Review,一支自动化的代理团队会在每个 pull request 上运行,现对 Team 和 Enterprise 计划开放研究预览;OpenAI 收购 Promptfoo——一家被 25% 财富 500 强使用的开源 AI 安全平台;Runway 开放 Characters API,允许基于 GWM-1 创建实时对话化身。同时,GitHub、Google、NVIDIA 和 Perplexity 也发布了多项重要更新。
Code Review for Claude Code — 在每个 PR 上的一支代理团队
Anthropic 于 3 月 9 日 推出了面向 Claude Code 的新功能:Code Review。该功能以研究预览(research preview)形式对 Team 和 Enterprise 计划开放,能在每个 pull request 上自动部署一支代理团队,以发现个人审查常漏掉的 bug。
该系统直接借鉴了 Anthropic 内部的实践。公司观察到人均代码产出在一年内增长了 200%,使得代码审查成为瓶颈。在 Code Review 推出之前,只有 16% 的内部 PR 会获得实质性评论。启用 Code Review 后,这一比例在大型 PR(修改超过 1000 行)上上升到 84%。
这些代理并行运行,并根据变更规模调整分析深度:轻微的 PR 会收到简短审查,复杂的重构将调用更多代理。一个具体示例:对生产服务的一行修改,表面看似无害,却发现了一个关键安全漏洞。在 TrueNAS 客户处,Code Review 识别出了一个在 ZFS 加密重构中预存的 bug。
该功能明确定位为比现有开源 GitHub Action 更昂贵,原因在于分析深度。管理员可以使用以下控制手段:
| Levier de contrôle | Description |
|---|---|
| Plafond mensuel par organisation | Limite totale sur toutes les revues du mois |
| Contrôle par dépôt | Activer les revues uniquement sur les dépôts choisis |
| Tableau de bord analytique | Suivi des PRs revues, taux d’acceptation, coûts totaux |
要启用 Code Review:Claude Code → 安装 GitHub App → 选择仓库。开发者无需额外配置——每当新 PR 创建时审查会自动开始。
“When a PR opens, Claude dispatches a team of agents to catch the bugs that slip past individual reviewers.”
🇨🇳 “当一个 PR 被打开时,Claude 会部署一支代理团队来检测在个人审查中被忽视的错误。” — @claudeai 在 X 上
🔗 博客:Bringing Code Review to Claude Code
OpenAI 收购 Promptfoo
3 月 9 日 — OpenAI 宣布收购 Promptfoo,Promptfoo 由 Ian Webster 和 Michael D’Angelo 共同创办,是一款用于识别并修复开发中 AI 系统脆弱点的安全平台,有超过 25% 的财富 500 强企业在使用该工具。
收购完成后,Promptfoo 的技术将直接集成到 OpenAI Frontier(OpenAI 的企业级平台,用于部署 AI 同事 AI coworkers)。Frontier 将新增三项能力:
| Capacité | Description |
|---|---|
| Tests de sécurité intégrés | Détection d’injections de prompt, jailbreaks, fuites de données et comportements hors politique |
| Intégration dans les workflows de développement | Identification et correction des risques agents en amont du déploiement |
| Conformité et traçabilité | Rapports et historique pour les exigences de gouvernance (compliance) |
Promptfoo 将在现有许可证下继续保持开源,OpenAI 将继续为现有客户提供支持。交易完成仍需满足常规交割条件。
Runway Characters — 实时视频代理 API
3 月 9 日 — Runway 推出 Characters,一项可用于创建实时对话角色的 API。基于其世界模型 GWM-1,该 API 可从一张图片生成富有表现力的化身,无需做微调(fine-tuning)。
这些角色支持完整的对话表现力——面部表情、眼球运动、唇动(lip-sync)、手势——并能在长对话中保持质量。API 可定制的方面包括:声音、人格、知识库、可用动作等。
该平台主要面向客服、培训和营销体验。首批合作伙伴包括 BBC 和 Silverside。该 API 现已在 dev.runwayml.com 可用,创建账户可获得 30 个免费积分。
🔗 Introducing Runway Characters
ChatGPT 中的交互式数学与科学可视化
3 月 10 日 — OpenAI 在 ChatGPT 中推出用于数学与科学学习的交互式动态可视化。已向所有已登录用户开放,覆盖 70 多个基础概念。
对于每个概念,ChatGPT 现在可以通过动态可视化进行解释,允许用户实时修改变量并立刻在图表和方程上看到影响。涵盖的概念包括:毕达哥拉斯定理、库仑定律、动能、三角恒等式、复利、理想气体方程等。
OpenAI 引用了一个数据:每周有 1.4 亿人使用 ChatGPT 学习数学和科学。该功能属于 NextGenAI 与 OpenAI Learning Lab 的计划范畴。
🔗 New ways to learn math and science in ChatGPT
Skills Codex 用于维护 SDK Agents — PR 合并量提升 45%
3 月 9 日 — OpenAI 发布了一份关于使用 Codex 和 skills 系统来自动维护其 SDK Agents(Python 和 TypeScript)的经验分享。在 2025 年 12 月到 2026 年 2 月期间,该方法促成了 457 个 PR 被合并,而此前同期为 316 个,增幅 +45%。
团队使用本地 skills (.agents/skills/) 和一个文件 AGENTS.md 来自动化常规工作流。已部署的部分 skills 包括:
| Skill | Fonction |
|---|---|
code-change-verification | Format, lint, types, tests — vérification obligatoire |
docs-sync | Audit documentation vs code |
pr-draft-summary | Génération automatique du titre et de la description PR |
integration-tests | Tests sur Node.js, Bun, Deno, Cloudflare Workers |
两个 SDK 的使用量显著:Python 在 PyPI 的 30 天下载量约为 1470 万,TypeScript 在 npm 上约为 150 万。
🔗 Using skills to accelerate OSS maintenance
Perplexity Computer 集成 Claude Code 与 GitHub CLI
3 月 9 日 — Perplexity 宣布在其于二月底推出的代理环境 Perplexity Computer 中直接集成 Claude Code 与 GitHub 的命令行界面(Command Line Interface)。
用户现在可以在 Perplexity Computer 内启动 Claude Code——Anthropic 的 CLI 工具,用于与复杂代码库交互——而无需离开环境。GitHub CLI 允许用户直接从界面对仓库执行操作。在演示中,团队将 Perplexity Computer 应用于一个真实的开源项目以展示其能力。这一发展将 Perplexity Computer 定位为由 AI 驱动的集成开发环境。
Dependabot 支持 pre-commit hooks
3 月 10 日 — GitHub Dependabot 现在支持 pre-commit hooks 的自动更新。只需在 dependabot.yml 中将生态系统设为 pre-commit,Dependabot 就会解析 .pre-commit-config.yaml,检测新版本并创建更新的 pull requests。
包括合并更新、PR 中嵌入的变更日志以及保持 YAML 格式化等功能。该功能支持托管在 GitHub、GitLab、Bitbucket 等平台的 hooks,并支持基于 Git tag 或 commit SHA 固定的 hooks。
🔗 Dependabot now supports pre-commit hooks
Genspark 成为 Microsoft Agent 365 的发布合作伙伴
3 月 10 日 — Genspark 被宣布为 Microsoft Agent 365 的发布合作伙伴。该平台现在可以在 Teams、Word 及其他 Microsoft 365 应用中运行,置于企业的安全环境内。CEO Eric Jing 在微软官方公告中有引述。
Gemini 在 Google Workspace 中的深度整合
3 月 10 日 — Google 宣布对 Gemini 进行针对各产品的优化。在 Google Drive 中,新增功能 “Ask Gemini” 允许用户直接在 Drive 界面查询其文件内容。Docs、Sheets 和 Slides 也部署了类似的优化。
NVIDIA × Thinky Machines — 部署 1 吉瓦 Vera Rubin 系统
3 月 10 日 — NVIDIA 宣布与 Thinky Machines 达成合作,部署至少 1 吉瓦的 NVIDIA Vera Rubin 系统,用于 frontier 模型的训练。该部署代表了用于 frontier 模型的大规模计算基础设施。
NVIDIA Nemotron 3 Nano 30B — 在 OpenRouter 免费可用
3 月 9 日 — NVIDIA Nemotron 3 Nano 30B 在 OpenRouter 上免费提供。该模型在平台上被 OpenClaw 广泛使用,主要用于构建代理系统。免费版本可在 openrouter.ai/nvidia/nemotron-3-nano-30b-a3b:free 获得。
🔗 Nemotron 3 Nano 30B sur OpenRouter
简讯
Claude Code v2.1.72(3 月 10 日)— 维护性更新,包含多项实用新增。/plan 现在接受直接参数(例如:/plan fix the auth bug),允许进入计划模式并立即启动而无需中间步骤。ExitWorktree 允许代理干净地退出隔离的 worktree 会话。/copy 将选择直接写入文件而不经过系统剪贴板——对远程环境(SSH、容器)很实用。变量 CLAUDE_CODE_DISABLE_CRON 允许在会话中禁用正在运行的 cron 作业 /loop。推理努力级别简化为:low (○)、medium (◐) 和 high (●),移除了最大等级。修复方面:SDK 调用中的 prompt 缓存已修复,在某些工作流中输入 tokens 降低至最多 12 倍——直接降低 API 成本。bundle 大小减少约 510 KB,语音模式的若干 bug(延迟、误报 “No speech detected”)已修复。
IH-Challenge — 指令层次数据集(3 月 10 日,OpenAI)— OpenAI 开源了 IH-Challenge,这是一个用于通过强化学习训练以提升 LLM 在指令冲突和 prompt 注入场景下鲁棒性的数据集。基于这些数据训练的内部模型 GPT-5 Mini-R 在 Developer/User Conflict benchmark 上从 0.83 提升至 0.95,且对通用能力没有明显回退。
Codex Security 扩展到 ChatGPT Pro 账户(3 月 7 日,OpenAI)— 应用安全代理 Codex Security(于 3 月 6 日以 research preview 发布)现已向 ChatGPT Pro 订阅用户开放。
Grok:语音模式下支持图片(3 月 8 日,xAI)— Grok 现在允许在语音会话中附加图片,用于实时视觉分析,无需离开对话。移动应用可用。
Antigravity v1.20.5(3 月 9 日,Google)— 稳定性更新。Google CLI 现在除了从 GEMINI.md 读取规则外,也会从 AGENTS.md 读取。默认启用自动继续(auto-continue)。修复了一个因 token 计数问题导致会话过早结束的 bug。
NotebookLM — 完全自定义信息图样式(3 月 10 日,Google)— Custom Infographic styles 功能已向所有 NotebookLM 用户推出。
Gemini 在 Pixel 上 — 后台自动任务(3 月 10 日,Google)— Pixel 版 Gemini 可在后台处理日常任务(购物、叫车预订、补货),同时保持用户对流程的控制。
ElevenLabs “11 Voices”(3 月 9 日)— 纪录片系列 “11 Voices” 将在 SXSW 首映,时间为 3 月 13 日周五 14:30。该系列呈现失去声音的人通过 ElevenLabs 的语音 AI 技术讲述自己的故事。
这意味着什么
Claude Code 的 Code Review 代表了团队将 AI 集成进工作流方式的结构性变化。最具代表性的指标——大型 PR 的覆盖率从 16% 提升到 84%——表明代理化的 AI 开始解决真实的组织问题,而不仅仅是技术问题。其定价定位(比轻量级的 GitHub Action 更贵)表明 Anthropic 面向愿意为深度分析付费的团队,而非仅追求量的客户。
OpenAI 收购 Promptfoo 加速了 AI 安全市场的整合。将 red-teaming 工具直接嵌入 Frontier,OpenAI 旨在把 AI 应用安全测试像 CI/CD 中的测试一样成为开发流程的内建环节。
Runway Characters 标志着视频代理商业化的一步:标准化的 API、无需 fine-tuning、30 个免费积分——实时对话化身的入门门槛显著降低。
来源 - 博客:将代码审查引入 Claude Code
- 推文 @claudeai — 代码审查
- 推文 @bcherny — 代码审查
- OpenAI 收购 Promptfoo
- 推文 @OpenAI — Promptfoo
- 推出 Runway Characters
- 推文 @runwayml — 角色
- 在 ChatGPT 中学习数学和科学的新方法
- 使用技能加速开源项目维护
- 推文 @AskPerplexity — Claude Code + GitHub CLI
- Dependabot 现在支持 pre-commit 钩子
- 推文 @genspark_ai — Microsoft Agent 365
- 推文 @GoogleAI — Workspace
- 推文 @NVIDIAAI — Thinky Machines
- OpenRouter 上的 Nemotron 3 Nano 30B
- 推文 @grok — 图像模式(语音)
- 推文 @OpenAIDevs — Codex Security Pro
- IH-Challenge 数据集
- Claude Code 更新日志
- 推文 @NotebookLM — 信息图样式
- 推文 @madebygoogle — Gemini Pixel
本文件已使用 gpt-5-mini 模型将 fr 版本翻译为 zh 语言。如需了解更多关于翻译过程的信息,请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator