2026年4月25日集中出现了围绕前沿模型和开发者工具的多项重大公告。DeepSeek-V4 以开源形式发布,并可在 NVIDIA Blackwell 上免费使用。GPT-5.5 进入 GitHub Copilot 和 OpenAI API 的正式可用阶段。由 Schwarz Group 提供 6 亿美元支持的 Cohere + Aleph Alpha 合并,为跨大西洋主权 AI 奠定了基础。在工具方面,Claude Code v2.1.119 和 Codex 的 Auto-review 模式扩展了开发代理的自主性。
DeepSeek-V4 现已全面可用
发布与开源
4月24日 — DeepSeek 同时发布 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。V4-Pro 是一个 1.6 万亿参数的 mixture-of-experts 模型(490 亿活跃参数),拥有 100 万 token 的上下文窗口,宣称性能可与最优秀的闭源模型相媲美。V4-Flash 更加紧凑(2840 亿/130 亿活跃参数),面向低延迟场景。两个模型在发布首日即开源,API 和演示可立即使用,技术报告已发布到 Hugging Face。
API 促销与集成
4月25日 — DeepSeek 宣布对 V4-Pro API 实施 -75% 促销,持续到 2026年5月5日(UTC 15:59)。Claude Code、OpenCode 和 OpenClaw 的集成已更新,以支持新模型。
NVIDIA Blackwell 上的 DeepSeek-V4-Pro,免费使用
4月24日 — NVIDIA 通过 build.nvidia.com 上的 NVIDIA NIM API 界面,让 DeepSeek-V4-Pro 可在 Blackwell 上免费访问。该公告获得了 16 万次观看。NVIDIA 还发布了 DeepSeek-V4-Pro 在 Blackwell Ultra 上配合 vLLM 的首批性能曲线(Pareto frontier)——这是高性能部署的早期基准点。
4月25日 — NVIDIA 同时强调了经典推理对开发代理的局限性:“Traditional inference wasn’t built for agentic coding”,指的是现代代理式工具会产生的数百次 API 调用。
🔗 NVIDIA NIM 上的 DeepSeek-V4-Pro 🔗 Blackwell Ultra Day 0
GPT-5.5 走出预览
在 GitHub Copilot 中正式可用
4月24日 — GPT-5.5 正在逐步向 GitHub Copilot 的 Pro+、Business 和 Enterprise 方案推出。可用范围覆盖 VS Code、Visual Studio、Copilot CLI、云端代理、github.com、移动应用(iOS 和 Android)、JetBrains IDE、Xcode 和 Eclipse。促销倍率设为 7.5×。Enterprise 和 Business 管理员需要在设置中启用该策略才能使用。
🔗 GitHub Copilot 更新日志 — GPT-5.5 GA
开发者 API 访问
4月24日 — 在面向公众发布的次日,OpenAI 开放了 GPT-5.5 的 API 访问。该模型可通过 Responses API 和 Chat Completions API 使用,拥有 100 万 token 的上下文窗口。面向高精度工作的 GPT-5.5-Pro 仅可通过 Responses API 访问。
“GPT-5.5 is available in the Responses and Chat Completions APIs with a 1M context window. GPT-5.5-pro is also available in the Responses API for higher-accuracy work.”
🇨🇳 “GPT-5.5 现已可在 Responses API 和 Chat Completions 中使用,拥有 100 万 token 的上下文窗口。GPT-5.5-Pro 也可通过 Responses API 供高精度工作使用。” — @OpenAIDevs
Perplexity Max 和 Personal Computer 上的 GPT-5.5
4月24日 — GPT-5.5 已向 Perplexity 的 Max 订阅用户开放,并作为默认编排模型部署到 Personal Computer 的 Pro 和 Max 方案中。
Bio Bug Bounty — 生物安全安全项目
4月23日 — OpenAI 启动了一个专注于 GPT-5.5 生物安全的漏洞赏金计划。邀请专门从事 AI 安全或生物安全的研究人员寻找能够绕过模型生物防护的通用 jailbreak。首个成功案例的主要奖励为 25,000 美元。申请开放至 2026年6月22日;测试将于 2026年4月28日至7月27日进行,仅限在 Codex Desktop 中使用 GPT-5.5,且需受邀并签署保密协议。
开发者工具:自主性持续扩展
Claude Code v2.1.119
4月25日 — Anthropic 发布 Claude Code v2.1.119,这是一次包含 40 多项变更的重要 CLI 更新。
| 领域 | 变更 |
|---|---|
| 配置 | /config 在 ~/.claude/settings.json 中持久化 |
| PR | --from-pr 支持 GitLab、Bitbucket、GitHub Enterprise |
| Hooks | PostToolUse + duration_ms 字段 |
| PowerShell | 权限模式下自动批准 |
| MCP | 并行连接子代理服务器 |
| 已修复的 Bug | 40+ |
/config 参数的持久化是最显眼的变化:主题、编辑器模式或 verbose 级别偏好会在重启后保留。--from-pr 参数现在接受 GitLab merge-request、Bitbucket pull-request 和 GitHub Enterprise 的 URL,这将工作流扩展到不使用 GitHub.com 的团队。PostToolUse 和 PostToolUseFailure 现在获得了 duration_ms 字段,这对 CI/CD 监控很有用。MCP 服务器的连接现在以并行方式进行,减少了多服务器工作流的启动时间。
Codex Auto-review — 带安全护栏的延长自主执行
4月24日 — OpenAI 为 Codex 宣布了 Auto-review,一种新的执行模式。该模式允许 Codex 在不需要每一步都寻求批准的情况下推进长任务。一个独立代理会在高风险步骤执行前对其进行评估,从而在不牺牲安全性的前提下,使测试、编译和长时间自动化工作流更加顺畅。
JetBrains 版 Copilot:Inline Agent Mode 进入预览
4月24日 — JetBrains IDE 的 Copilot 插件更新带来了多项功能:公开预览中的内联代理模式(快捷键 Shift+Ctrl+I 或 Shift+Cmd+I)、改进的 Next Edit Suggestions (NES),包括水印式预览和远程修改,以及针对代理工具调用的全局自动批准。
NVIDIA Dynamo — 为代理重新设计的推理
4月25日 — NVIDIA 发布 Dynamo,这是对推理栈的重构,旨在满足代理式工具的负载特征。像 Claude Code、Codex 或 Copilot 这样的代理在每次会话中会连续发起数百次 API 调用,并在每一步重新组合上下文,形成推高每个 token 成本的瓶颈。Dynamo 结合了四个组件:感知 KV 缓存的路由、面向代理的调度、多层缓存和统一编排。NVIDIA 宣布,在更高缓存命中率和更低延迟的情况下,吞吐量最高可提升 7×。
主权与企业合作
Cohere + Aleph Alpha:与 Schwarz Group 600 万美元支持下的跨大西洋合并
4月24日 — Cohere(加拿大)和 Aleph Alpha(德国)宣布其合并计划。Schwarz Group——Lidl 和 Kaufland 的母公司——为 Cohere 的 Series E 提供 6 亿美元(约 5 亿欧元)的结构化融资投资。合并后的平台将托管在 STACKIT 上,这是 Schwarz Digits 的主权云。
“Sovereign AI for the world. Cohere & Aleph Alpha form transatlantic AI powerhouse anchored in Canada & Germany!”
🇨🇳 “面向世界的主权 AI。Cohere 与 Aleph Alpha 组成了扎根加拿大和德国的跨大西洋 AI 强权!” — @cohere 在 X 上
该协议面向受监管行业、政府以及估值约 6000 亿美元的主权 AI 市场。它仍需 Aleph Alpha 股东批准后方可生效。
Anthropic 与 NEC:日本首个全球合作伙伴关系
4月24日 — Anthropic 宣布与 NEC Corporation 建立战略合作,后者成为 Anthropic 的首个日本全球合作伙伴。NEC 将在全球范围内向约 30,000 名集团员工部署 Claude。
| 方面 | 详情 |
|---|---|
| 涉及员工 | ~30,000(NEC 全球集团) |
| 部署产品 | Claude、Claude Opus 4.7、Claude Code、Claude Cowork |
| 目标行业 | 金融、制造业、网络安全、地方政府 |
| 计划 | NEC BluStellar Scenario |
在内部,NEC 正在建立一个卓越中心,以在 “Client Zero” 计划框架下培训一支大规模 AI 工程团队。面向客户,NEC 和 Anthropic 将共同为金融、制造业以及日本地方政府部门开发解决方案。
Meta 与 AWS 联手推动服务数十亿用户的代理式 AI
4月24日 — Meta 宣布与 AWS 达成协议,将数千万个 Graviton5 核心整合进其基础设施。目标是支持面向数十亿用户的代理式 AI 所需的 CPU 密集型工作负载。
Gemini:产品与研究更新
2026年4月 Gemini Drops — Lyria 3 Pro,Gemini Live v3.1
4月24日 — Google 发布第 10 期 Gemini Drops。Lyria 3 Pro 可直接在 Gemini 中创作最长 3 分钟的音乐片段,Plus、Pro 和 Ultra 订阅用户均可使用。Gemini Live v3.1 快了 20%,并提供两倍的记忆上下文。Personal Intelligence 扩展到国际范围(不包括欧洲经济区、瑞士、英国、韩国、澳大利亚和尼日利亚)。分支对话功能(branching)正向 20% 的用户推出。
Gemini Embedding 2 正式可用
4月22日 — Gemini Embedding 2 在 Gemini API 和 Vertex AI 中进入正式可用(GA)阶段。该向量表示模型面向语义搜索、检索增强生成(RAG)和分类。
Decoupled DiLoCo — 跨区域分布式训练
4月23日 — Google DeepMind 发布 Decoupled DiLoCo,这是一种在低带宽网络上进行分布式训练的方法。Gemma 12B 已在美国 4 个区域、采用 TPU6e 和 TPUv5p 的混合配置上完成训练。该方法为无需通常所需高速互连的全球规模去中心化模型训练铺平了道路。
🔗 Decoupled DiLoCo — Google DeepMind
替代模型:Qwen 与 Grok
Qwen3.6-27B — 面向代理式编程的旗舰稠密模型
4月22日 — Alibaba 发布 Qwen3.6-27B,这是一个采用 Apache 2.0 许可证开源的 270 亿参数稠密模型。尽管体积紧凑,它在主要代理式编程基准上超越了 Qwen3.5-397B-A17B——一个 3970 亿参数、其中 170 亿激活的 MoE 模型——在 SWE-Bench Verified 上得分 77.2%,高于前代的 76.2%。公告强调了三个方向:在所有主要基准上超越上一代的 agentic coding、强大的文本与多模态推理,以及无需 MoE 复杂性的稠密部署。
该模型在同一个 checkpoint 中同时支持 thinking 和 non-thinking 模式。它可在 Hugging Face(Qwen/Qwen3.6-27B,包含 FP8 变体)和 ModelScope 上获得,并配有专属技术博客和 Github。该公告在 X 上获得了 350 万次观看。
Qwen-Image-2.0-Pro — 全球第 9 名 Text-to-Image
4月25日 — Alibaba Qwen 发布 Qwen-Image-2.0-Pro,在 Text-to-Image Arena 排行榜上位列全球第 9,在人像类别中位列第 6。该模型可通过 Alibaba Cloud API 和 ModelScope 使用。
Grok Voice Think Fast 1.0 — Tau Voice Bench 第 1 名
4月23日 — xAI 通过 xAI Console API 推出 grok-voice-think-fast-1.0 模型。该模型宣称在 Tau Voice Bench 上排名第一,并且具备内置推理且不增加额外延迟。它已经在 Starlink 的生产环境中用于客户支持。该架构是统一的,与 4 月宣布的 Grok STT/TTS API 不同。
Grok Imagine — lip sync 改进
4月25日 — Grok Imagine 宣布对所有 image-to-video 生成的唇形同步(lip sync)和音频质量进行了改进。
媒体生成与语音代理
Kling AI 4K — 从低分辨率原生放大
4月24日 — Kling AI 推出 Kling 4K,这是一项可将低分辨率源素材原生放大到 4K 的图像增强功能。该公告以“Blurry in. 4K out.”概括,获得了 582 万次观看。此功能不同于 Kling Video 3.0。
Runway 集成 GPT Image 2
4月24日 — Runway 将 OpenAI 的 GPT Image 2 集成到其视频创作平台中。
ElevenLabs × Customers Bank — 银行业语音代理
4月24日 — ElevenLabs 宣布在 Customers Bank(资产 250 亿美元)部署 ElevenAgents。共部署了三个代理:24 小时客户支持、新客户引导,以及为顾问提供实时辅导。
ElevenLabs — 大使计划
4月23日 — ElevenLabs 开放其大使计划的申请,该计划分为两个层级:Community Builders 和 大使,提供积分、周边礼品以及新功能的抢先体验。该公告已获得 116,000 次浏览。
Anthropic 研究:安全与代理
选举保护措施 — 评估结果
4月24日 — 随着美国 2026 年中期选举临近,Anthropic 发布了其选举保护措施的总结。Claude Opus 4.7 和 Sonnet 4.6 在衡量政治回答平衡性的评估中分别获得了 95% 和 96%。
| 模型 | 政治符合度 | 拒绝影响操作 | 已启用网页搜索 |
|---|---|---|---|
| Opus 4.7 | 100 % | 94 % | 92 % |
| Sonnet 4.6 | 99,8 % | 90 % | 95 % |
一个 TurboVote 横幅(Democracy Works 的非党派资源)将显示在 Claude.ai 上,以引导用户获取有关 2026 年中期选举投票的可靠信息。
Project Deal — 作为谈判者的 Claude 代理
4月24日 — Anthropic 发布了 Project Deal 的结果,这是一项关于类 Craigslist 市场中 AI 代理的内部实验。在一周时间里,Claude 代理代表旧金山办公室的员工与同事之间买卖物品。总计有 186 笔交易在四种并行模型配置下达成。
| 指标 | 数值 |
|---|---|
| 持续时间 | 1 周 |
| 配置 | 4(全 Opus 4.7、全 Haiku、2 种混合) |
| 成交交易 | 186 |
| Opus 相较 Haiku 的优势 | 平均 +2 笔交易,价格更高 |
| 强硬指令效果 | 统计上不显著 |
“New Anthropic research: Project Deal. We created a marketplace for employees in our San Francisco office—like Craigslist—where Claude agents negotiated deals on their behalf.”
🇨🇳 “Anthropic 的新研究:Project Deal。我们为旧金山办公室员工创建了一个市场——类似 Craigslist——让 Claude 代理代表他们进行交易谈判。” — @AnthropicAI 在 X 上
最值得注意的发现是:强硬指令(“强硬谈判”)对结果没有产生统计上显著的影响——不是因为指令执行得不好,而是因为市场本身的约束。
这意味着什么
4 月 25 日这一天表明,围绕少数几个重磅趋势正在迅速收敛。对于前沿模型而言,DeepSeek-V4 和 GPT-5.5 为可免费获取的能力设定了新的基线:一百万 token 的上下文不再是高端差异化特征。DeepSeek-V4-Pro 在 NVIDIA Blackwell 上免费推出,再加上 API 75% 的促销,表明其正与闭源模型展开直接价格竞争。
在开发者工具方面,代理自主性的扩展正在多个方向同时落地——Claude Code v2.1.119、Codex Auto-review、JetBrains 中的 Inline Agent Mode。这些更新共同指向一个目标:在保持高风险操作控制点的同时,减少长流程中的人工中断。Project Deal 提出的“代理代表我们行动时的法律框架”问题,在这一背景下显得尤为重要。
Cohere + Aleph Alpha 与 Schwarz Group 6 亿美元的合并,是欧洲主权 AI 最具结构性的信号。它打造了一个面向政府和受监管行业的跨大西洋主体,并配备专用云基础设施(STACKIT),瞄准一个估值 6,000 亿美元的市场。Anthropic + NEC 的并行合作则表明,同样的主权逻辑也正在延伸至亚洲。
来源
- Claude Code v2.1.119 变更日志
- Anthropic 与 NEC
- 选举保护措施 — Anthropic
- Project Deal — Anthropic
- GPT-5.5 API OpenAI
- Codex Auto-review
- GPT-5.5 Bio Bug Bounty
- Gemini Drops 2026 年 4 月
- Gemini Embedding 2 GA
- Decoupled DiLoCo — Google DeepMind
- DeepSeek-V4 发布
- DeepSeek-V4-Pro API 促销
- Meta × AWS Graviton5
- Qwen-Image-2.0-Pro
- Grok Voice Think Fast 1.0
- Grok Imagine lip sync
- Qwen3.6-27B
- GPT-5.5 GA GitHub Copilot
- Copilot JetBrains Inline Agent Mode
- GPT-5.5 在 Perplexity Max 上
- Cohere × Aleph Alpha
- NVIDIA NIM 上的 DeepSeek-V4-Pro
- NVIDIA Blackwell Ultra Day 0
- NVIDIA Dynamo — 代理推理
- Runway × GPT Image 2
- Kling AI 4K
- ElevenLabs × Customers Bank
- ElevenLabs 大使计划
此文档已使用 gpt-5.4-mini 模型从 fr 版本翻译为 zh 语言。有关翻译过程的更多信息,请参阅 https://github.com/jls42/ai-powered-markdown-translator