搜索

Claude Code 的 Code Review、OpenAI 收购 Promptfoo、Runway Characters API

Claude Code 的 Code Review、OpenAI 收购 Promptfoo、Runway Characters API

2026年3月10日这一天由三个重要公告主导:Anthropic 为 Claude Code 推出 Code Review,一支自动化的代理团队会在每个 pull request 上运行,现对 Team 和 Enterprise 计划开放研究预览;OpenAI 收购 Promptfoo——一家被 25% 财富 500 强使用的开源 AI 安全平台;Runway 开放 Characters API,允许基于 GWM-1 创建实时对话化身。同时,GitHub、Google、NVIDIA 和 Perplexity 也发布了多项重要更新。


Code Review for Claude Code — 在每个 PR 上的一支代理团队

Anthropic 于 3 月 9 日 推出了面向 Claude Code 的新功能:Code Review。该功能以研究预览(research preview)形式对 Team 和 Enterprise 计划开放,能在每个 pull request 上自动部署一支代理团队,以发现个人审查常漏掉的 bug。

该系统直接借鉴了 Anthropic 内部的实践。公司观察到人均代码产出在一年内增长了 200%,使得代码审查成为瓶颈。在 Code Review 推出之前,只有 16% 的内部 PR 会获得实质性评论。启用 Code Review 后,这一比例在大型 PR(修改超过 1000 行)上上升到 84%。

这些代理并行运行,并根据变更规模调整分析深度:轻微的 PR 会收到简短审查,复杂的重构将调用更多代理。一个具体示例:对生产服务的一行修改,表面看似无害,却发现了一个关键安全漏洞。在 TrueNAS 客户处,Code Review 识别出了一个在 ZFS 加密重构中预存的 bug。

该功能明确定位为比现有开源 GitHub Action 更昂贵,原因在于分析深度。管理员可以使用以下控制手段:

Levier de contrôleDescription
Plafond mensuel par organisationLimite totale sur toutes les revues du mois
Contrôle par dépôtActiver les revues uniquement sur les dépôts choisis
Tableau de bord analytiqueSuivi des PRs revues, taux d’acceptation, coûts totaux

要启用 Code Review:Claude Code → 安装 GitHub App → 选择仓库。开发者无需额外配置——每当新 PR 创建时审查会自动开始。

“When a PR opens, Claude dispatches a team of agents to catch the bugs that slip past individual reviewers.”

🇨🇳 “当一个 PR 被打开时,Claude 会部署一支代理团队来检测在个人审查中被忽视的错误。”@claudeai 在 X 上

🔗 博客:Bringing Code Review to Claude Code


OpenAI 收购 Promptfoo

3 月 9 日 — OpenAI 宣布收购 Promptfoo,Promptfoo 由 Ian Webster 和 Michael D’Angelo 共同创办,是一款用于识别并修复开发中 AI 系统脆弱点的安全平台,有超过 25% 的财富 500 强企业在使用该工具。

收购完成后,Promptfoo 的技术将直接集成到 OpenAI Frontier(OpenAI 的企业级平台,用于部署 AI 同事 AI coworkers)。Frontier 将新增三项能力:

CapacitéDescription
Tests de sécurité intégrésDétection d’injections de prompt, jailbreaks, fuites de données et comportements hors politique
Intégration dans les workflows de développementIdentification et correction des risques agents en amont du déploiement
Conformité et traçabilitéRapports et historique pour les exigences de gouvernance (compliance)

Promptfoo 将在现有许可证下继续保持开源,OpenAI 将继续为现有客户提供支持。交易完成仍需满足常规交割条件。

🔗 OpenAI to acquire Promptfoo


Runway Characters — 实时视频代理 API

3 月 9 日 — Runway 推出 Characters,一项可用于创建实时对话角色的 API。基于其世界模型 GWM-1,该 API 可从一张图片生成富有表现力的化身,无需做微调(fine-tuning)。

这些角色支持完整的对话表现力——面部表情、眼球运动、唇动(lip-sync)、手势——并能在长对话中保持质量。API 可定制的方面包括:声音、人格、知识库、可用动作等。

该平台主要面向客服、培训和营销体验。首批合作伙伴包括 BBC 和 Silverside。该 API 现已在 dev.runwayml.com 可用,创建账户可获得 30 个免费积分。

🔗 Introducing Runway Characters


ChatGPT 中的交互式数学与科学可视化

3 月 10 日 — OpenAI 在 ChatGPT 中推出用于数学与科学学习的交互式动态可视化。已向所有已登录用户开放,覆盖 70 多个基础概念。

对于每个概念,ChatGPT 现在可以通过动态可视化进行解释,允许用户实时修改变量并立刻在图表和方程上看到影响。涵盖的概念包括:毕达哥拉斯定理、库仑定律、动能、三角恒等式、复利、理想气体方程等。

OpenAI 引用了一个数据:每周有 1.4 亿人使用 ChatGPT 学习数学和科学。该功能属于 NextGenAI 与 OpenAI Learning Lab 的计划范畴。

🔗 New ways to learn math and science in ChatGPT


Skills Codex 用于维护 SDK Agents — PR 合并量提升 45%

3 月 9 日 — OpenAI 发布了一份关于使用 Codex 和 skills 系统来自动维护其 SDK Agents(Python 和 TypeScript)的经验分享。在 2025 年 12 月到 2026 年 2 月期间,该方法促成了 457 个 PR 被合并,而此前同期为 316 个,增幅 +45%

团队使用本地 skills (.agents/skills/) 和一个文件 AGENTS.md 来自动化常规工作流。已部署的部分 skills 包括:

SkillFonction
code-change-verificationFormat, lint, types, tests — vérification obligatoire
docs-syncAudit documentation vs code
pr-draft-summaryGénération automatique du titre et de la description PR
integration-testsTests sur Node.js, Bun, Deno, Cloudflare Workers

两个 SDK 的使用量显著:Python 在 PyPI 的 30 天下载量约为 1470 万,TypeScript 在 npm 上约为 150 万。

🔗 Using skills to accelerate OSS maintenance


Perplexity Computer 集成 Claude Code 与 GitHub CLI

3 月 9 日 — Perplexity 宣布在其于二月底推出的代理环境 Perplexity Computer 中直接集成 Claude Code 与 GitHub 的命令行界面(Command Line Interface)。

用户现在可以在 Perplexity Computer 内启动 Claude Code——Anthropic 的 CLI 工具,用于与复杂代码库交互——而无需离开环境。GitHub CLI 允许用户直接从界面对仓库执行操作。在演示中,团队将 Perplexity Computer 应用于一个真实的开源项目以展示其能力。这一发展将 Perplexity Computer 定位为由 AI 驱动的集成开发环境。

🔗 Tweet @AskPerplexity


Dependabot 支持 pre-commit hooks

3 月 10 日 — GitHub Dependabot 现在支持 pre-commit hooks 的自动更新。只需在 dependabot.yml 中将生态系统设为 pre-commit,Dependabot 就会解析 .pre-commit-config.yaml,检测新版本并创建更新的 pull requests。

包括合并更新、PR 中嵌入的变更日志以及保持 YAML 格式化等功能。该功能支持托管在 GitHub、GitLab、Bitbucket 等平台的 hooks,并支持基于 Git tag 或 commit SHA 固定的 hooks。

🔗 Dependabot now supports pre-commit hooks


Genspark 成为 Microsoft Agent 365 的发布合作伙伴

3 月 10 日 — Genspark 被宣布为 Microsoft Agent 365 的发布合作伙伴。该平台现在可以在 Teams、Word 及其他 Microsoft 365 应用中运行,置于企业的安全环境内。CEO Eric Jing 在微软官方公告中有引述。

🔗 Tweet @genspark_ai


Gemini 在 Google Workspace 中的深度整合

3 月 10 日 — Google 宣布对 Gemini 进行针对各产品的优化。在 Google Drive 中,新增功能 “Ask Gemini” 允许用户直接在 Drive 界面查询其文件内容。Docs、Sheets 和 Slides 也部署了类似的优化。

🔗 Tweet @GoogleAI


NVIDIA × Thinky Machines — 部署 1 吉瓦 Vera Rubin 系统

3 月 10 日 — NVIDIA 宣布与 Thinky Machines 达成合作,部署至少 1 吉瓦的 NVIDIA Vera Rubin 系统,用于 frontier 模型的训练。该部署代表了用于 frontier 模型的大规模计算基础设施。

🔗 Tweet @NVIDIAAI


NVIDIA Nemotron 3 Nano 30B — 在 OpenRouter 免费可用

3 月 9 日 — NVIDIA Nemotron 3 Nano 30B 在 OpenRouter 上免费提供。该模型在平台上被 OpenClaw 广泛使用,主要用于构建代理系统。免费版本可在 openrouter.ai/nvidia/nemotron-3-nano-30b-a3b:free 获得。

🔗 Nemotron 3 Nano 30B sur OpenRouter


简讯

Claude Code v2.1.723 月 10 日)— 维护性更新,包含多项实用新增。/plan 现在接受直接参数(例如:/plan fix the auth bug),允许进入计划模式并立即启动而无需中间步骤。ExitWorktree 允许代理干净地退出隔离的 worktree 会话。/copy 将选择直接写入文件而不经过系统剪贴板——对远程环境(SSH、容器)很实用。变量 CLAUDE_CODE_DISABLE_CRON 允许在会话中禁用正在运行的 cron 作业 /loop。推理努力级别简化为:low (○)、medium (◐) 和 high (●),移除了最大等级。修复方面:SDK 调用中的 prompt 缓存已修复,在某些工作流中输入 tokens 降低至最多 12 倍——直接降低 API 成本。bundle 大小减少约 510 KB,语音模式的若干 bug(延迟、误报 “No speech detected”)已修复。

IH-Challenge — 指令层次数据集3 月 10 日,OpenAI)— OpenAI 开源了 IH-Challenge,这是一个用于通过强化学习训练以提升 LLM 在指令冲突和 prompt 注入场景下鲁棒性的数据集。基于这些数据训练的内部模型 GPT-5 Mini-R 在 Developer/User Conflict benchmark 上从 0.83 提升至 0.95,且对通用能力没有明显回退。

Codex Security 扩展到 ChatGPT Pro 账户3 月 7 日,OpenAI)— 应用安全代理 Codex Security(于 3 月 6 日以 research preview 发布)现已向 ChatGPT Pro 订阅用户开放。

Grok:语音模式下支持图片3 月 8 日,xAI)— Grok 现在允许在语音会话中附加图片,用于实时视觉分析,无需离开对话。移动应用可用。

Antigravity v1.20.53 月 9 日,Google)— 稳定性更新。Google CLI 现在除了从 GEMINI.md 读取规则外,也会从 AGENTS.md 读取。默认启用自动继续(auto-continue)。修复了一个因 token 计数问题导致会话过早结束的 bug。

NotebookLM — 完全自定义信息图样式3 月 10 日,Google)— Custom Infographic styles 功能已向所有 NotebookLM 用户推出。

Gemini 在 Pixel 上 — 后台自动任务3 月 10 日,Google)— Pixel 版 Gemini 可在后台处理日常任务(购物、叫车预订、补货),同时保持用户对流程的控制。

ElevenLabs “11 Voices”3 月 9 日)— 纪录片系列 “11 Voices” 将在 SXSW 首映,时间为 3 月 13 日周五 14:30。该系列呈现失去声音的人通过 ElevenLabs 的语音 AI 技术讲述自己的故事。


这意味着什么

Claude Code 的 Code Review 代表了团队将 AI 集成进工作流方式的结构性变化。最具代表性的指标——大型 PR 的覆盖率从 16% 提升到 84%——表明代理化的 AI 开始解决真实的组织问题,而不仅仅是技术问题。其定价定位(比轻量级的 GitHub Action 更贵)表明 Anthropic 面向愿意为深度分析付费的团队,而非仅追求量的客户。

OpenAI 收购 Promptfoo 加速了 AI 安全市场的整合。将 red-teaming 工具直接嵌入 Frontier,OpenAI 旨在把 AI 应用安全测试像 CI/CD 中的测试一样成为开发流程的内建环节。

Runway Characters 标志着视频代理商业化的一步:标准化的 API、无需 fine-tuning、30 个免费积分——实时对话化身的入门门槛显著降低。


来源 - 博客:将代码审查引入 Claude Code

本文件已使用 gpt-5-mini 模型将 fr 版本翻译为 zh 语言。如需了解更多关于翻译过程的信息,请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator