搜索

Project Glasswing:10,000 个漏洞、GitHub Gartner Leader、Mistral 收购 Emmi AI

Project Glasswing:10,000 个漏洞、GitHub Gartner Leader、Mistral 收购 Emmi AI

ai-powered-markdown-translator

使用 gpt-5.4-mini 将文章从法语翻译成中文。

在 GitHub 上查看项目 ↗

对于 AI 生态来说,这是密度极高的两天:Anthropic 发布 Project Glasswing 的首份阶段性成果,数据重新定义了漏洞发现的规模;GitHub Copilot 与 OpenAI Codex 一同登上同一领奖台,前者连续第三年获得 Gartner Leader 头衔,后者也跻身其中;Mistral 则在工业 AI 领域完成了一次战略收购。开发者工具方面,Gemini CLI 0.43.0、Antigravity 2.0.6 和 Bumblebee 进一步丰富了正在高速演进的生态。


Project Glasswing — 一个月内检测到 10,000 个漏洞

5 月 22 日 — Project Glasswing 启动一个月后,Anthropic 发布了这项由约五十个合作伙伴和 Claude Mythos Preview 模型参与的协作式网络安全计划的首份总结,数据超出了最初预期。

“Last month we launched Project Glasswing, our collaborative AI cybersecurity initiative. Since then, we and our partners have found more than ten thousand high- or critical-severity vulnerabilities in essential software.”

🇨🇳 上个月,我们启动了 Project Glasswing,这是一项由 AI 驱动的协作式网络安全计划。自那以后,我们和我们的合作伙伴已经在关键软件中发现了超过一万项高危或关键级漏洞。@AnthropicAI 在 X 上

这些结果在多个方面都十分惊人。作为合作伙伴之一,Cloudflare 单独发现了 2,000 个漏洞——其中 400 个为高危或关键级——而且其误报率低于人类测试人员。在开源领域,Anthropic 使用 Mythos Preview 扫描了 1,000 多个项目,识别出估计 6,202 个高危或关键级漏洞(总计 23,019 个)。在由独立机构评估的 1,752 个漏洞中,90.6% 被证实为真阳性——这一比例验证了该模型在此类任务上的可靠性。

Mozilla 的案例体现了这种加速:Firefox 150 发现了 271 个漏洞,是使用此前方法的 Firefox 148 的十倍。

指标数值
高危/关键级漏洞(合作伙伴)10,000+
扫描的开源项目1,000+
开源高危/关键级漏洞(估计)6,202
真阳性率(独立评估)90.6 %
Cloudflare 漏洞(其中高危/关键级)2,000(400)
Firefox 150 vs Firefox 148 漏洞数271 vs ~27(×10)
通过 Claude Security 修复的漏洞(3 周)2,100+

有三项新功能伴随这一总结推出。面向 Enterprise 客户的 Claude Security 正式进入公测:在三周内,这一由 Claude Opus 4.7 驱动的工具已经修复了 2,100+ 个漏洞。Cyber Verification Program 为真正的安全专业人士开放了对部分限制较少的模型访问。最后,Anthropic 还向合作伙伴分享了已开发的扫描工具:基于子代理的扫描框架、威胁模型构建器,以及 Skills 库。

还有一个值得强调的重点:检测速度已经快到,真正的瓶颈变成了修复。部分开源维护者要求 Anthropic 放慢披露节奏,因为他们缺乏足够的人力来及时部署补丁。

英国的 AI Security Institute 也予以确认:Mythos Preview 是首个能端到端解决他们两类网络攻击的模型。

🔗 Project Glasswing 总结 — Anthropic


GitHub Copilot — 连续第 3 年成为 Gartner Enterprise AI Coding Agents Leader

5 月 22 日 — GitHub Copilot 连续第三年被认定为 Gartner Magic Quadrant for Enterprise AI Coding Agents 中的 Leader。GitHub 的 CPO Mario Rodriguez 文章指出了一个 Gartner 直接量化的范式转变。

“By 2028, asynchronous AI coding agent workflows will improve software engineering team productivity by 30% to 50%, surpassing the 0% to 20% gains from AI code assistants in 2025.”

🇨🇳 到 2028 年,异步的 AI 编码代理工作流将把软件工程团队的生产力提升 30% 到 50%,超过 2025 年 AI 代码助手 0% 到 20% 的增益。 — Gartner,引用自 GitHub 总结

这个数字(+30% 到 50%,而当下仅为 0% 到 20%)说明了点状辅助与异步代理式工作之间的差距。Rodriguez 进一步解释:瓶颈已不在代码生成,而在交付——评审、安全、治理和部署。

GitHub Copilot 在这份报告中的定位,建立在其对整个软件开发生命周期(Software Development Life Cycle)的覆盖之上。不只是自动补全或函数生成,而是代码评审、漏洞检测、治理与部署。文章描述了一种新的工作方式:开发者把任务分配给 issue 上的代理,然后离开,之后再回来审查、引导和验证——而不是逐行写代码。

这一认可还源自 GitHub 将改进锚定在对 GitHub 上软件实际构建方式的理解之中,这让它在没有这种规模级数据的竞争者面前拥有结构性优势。

🔗 GitHub 博客 — Gartner MQ Enterprise AI Coding Agents Leader


Gartner 与企业市场:OpenAI Codex 跻身 Leaders 行列

5 月 22 日 — OpenAI 宣布,Codex 也获得了 Gartner Magic Quadrant for Enterprise AI Coding Agents 2026 的认可。报告评估了 Codex,其每周用户数已超过 400 万,并被 Cisco、Datadog、Dell Technologies 和 NVIDIA 使用。

Gartner 对四个维度给出了积极评价:代理式软件开发(agentic software development)、企业治理、沙箱化(sandboxing)以及灵活的部署选项。覆盖的开发者表面包括应用、IDE 扩展、CLI、SDK 和云端编排。

Cisco 的案例很有代表性:该公司使用 Codex 开发了其 AI Defense 安全平台的大部分内容,将原本需要几个季度的交付周期压缩到了几周。

截至 6 月 12 日,符合资格的 enterprise 账户可享受 Codex 新用户两个月的免费使用。

🔗 OpenAI — Gartner 2026 认可


Mistral 收购 Emmi AI — 押注工业计算物理

5 月 22 日 — Mistral AI 宣布收购奥地利初创公司 Emmi AI。后者是将计算物理应用于 AI 的先驱,由 Johannes Brandstetter 创立。Emmi 团队——30 多名研究员和工程师——将于 2026 年 5 月加入 Mistral 的科学与应用 AI 团队。

Emmi AI 开发了大规模工程模型,能够把原本需要数天计算的物理仿真替换为实时结果,为工业资产优化创建数字孪生(digital twins),并为复杂工程工作流中的 AI 代理提供支持。目标行业包括:航空航天、汽车和半导体。

联合创始人兼首席科学官 Guillaume Lample 表示,希望打造“首个由物理驱动的完整 AI 软件栈”,以解决几十年来一直卡住的技术难题。CEO Arthur Mensch 则认为,这将有助于“巩固 Mistral 在工业 AI 领域的领导地位”。

🔗 Mistral 官方公告 — 收购 Emmi AI


DeepSeek — V4-Pro API 75% 折扣永久化

5 月 22 日 — DeepSeek 将其 V4-Pro API 所适用的 75% 促销折扣永久化。该折扣最初在 DeepSeek-V4 于 4 月 24 日发布时推出,随后首次延长至 5 月 31 日,如今则变为无期限适用。

We are making our discount permanent! Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life!

🇨🇳 我们将折扣永久保留!欢迎使用 DeepSeek-V4-Pro 构建,并让你创新的想法落地成真!@deepseek_ai 在 X 上

指标每百万 tokens 的价格
输入(cache hit)$0,003625
输入(cache miss)$0,435
输出$0,87

相比之下,未打折的原始价格为 $0,0145 / $1,74 / $3,48。1 百万 tokens 的上下文窗口以及 Thinking/Non-Thinking 模式对 V4-Flash 和 V4-Pro 两个版本都保持不变。

🔗 DeepSeek API 定价


Google CLI 生态:Gemini CLI v0.43.0 与 Antigravity 2.0.6

Gemini CLI v0.43.0 — 外科式修改与会话可移植性

5 月 22 日 — Gemini CLI 0.43.0 带来了三项实用改进。外科式代码编辑Surgical Code Edits)引导 Gemini 模型使用 edit 工具来做精准修改,而不是重写整段内容——这能提升针对性修改的速度和准确性。会话导出与导入 允许将会话保存到文件中,并通过新的 CLI 标志重新导入,从而更方便地在不同机器之间继续工作,或共享上下文。自适应 token 估算 则引入了更精确的计算器,用于长会话中的上下文管理。

🔗 Gemini CLI 更新日志

Antigravity 2.0.6 — IDE 集成完成

5 月 22 日 — Antigravity 2.0.6 现已进入渐进式发布,新增了与 Antigravity IDE 的原生集成。此次更新完善了 Google I/O 2026 上公布的 Antigravity 生态:在 5 月 19 日发布 CLI 和 SDK 之后,这个集成开发环境如今终于拥有了与编码代理的直接连接。本版本还带来了另外两项改进。

🔗 Antigravity 更新日志

Google AI I/O Developer Recap — 生态全景

5 月 22 日 — @GoogleAI 发布了对 Google I/O 2026 开发者公告的结构化回顾,浏览量达 71,000。该串文展示了完整的 Antigravity 生态(Antigravity 2.0、CLI、SDK、扩展后的限制额度)、AI Studio 的新功能(带 Kotlin 的 Vibe Code Android、导出到 Antigravity、即将推出的 iOS/Android 移动应用),以及面向 Web/Android 的工具:Gemini API 中的 Managed Agents、Android CLI 和开源 skills、Chrome 149 中处于 origin trial 的 WebMCP,以及面向代理的 Chrome DevTools。

🔗 @GoogleAI 回顾串文


安全与来源:Perplexity Bumblebee 与 SynthID

Perplexity — Bumblebee 开源

5 月 22 日 — Perplexity 将其内部安全扫描器 Bumblebee 开源。这是一款用 Go 编写、用于保护开发环境免受软件供应链风险的工具。该工具以只读方式运行——绝不会触碰包管理器,也不会触发任何 postinstall 脚本——并覆盖 npm、pnpm、Yarn、Bun、PyPI、Go modules、RubyGems、Composer、MCP 配置、VS Code/Cursor/Windsurf/VSCodium 扩展,以及 Chrome、Edge、Brave、Arc 和 Firefox 扩展。

共有三种扫描配置:基础(MDM 常规检查)、项目级(针对某个目录)、深度(主动事件)。Perplexity Computer 负责撰写威胁目录更新,并在进入扫描前经过人工审查。发布推文总浏览量达 552,000 次。

🔗 Perplexity 博客 — Bumblebee 开源

SynthID — 合作伙伴扩展与内置检测

5 月 22 日 — Google DeepMind 宣布对 SynthID 进行双重扩展:这是其为 AI 生成内容设计的不可见数字水印(watermark)。在生产侧,更多合作伙伴现在可以将 SynthID 集成到其生成流程中。在检测侧,用户可以直接通过 Gemini 应用或 Google Search 验证内容是否由 AI 生成,无需第三方工具。该公告延续了 5 月 19 日在 Google I/O 2026 上发布的 SynthID 扩展。

🔗 SynthID 公告 — @GoogleDeepMind


Genspark 基于 Claude 构建:CTO 访谈

5 月 22 日 — Genspark 的 CTO 兼联合创始人 Kay Zhu 与 Anthropic 工程团队进行了一次非脚本化对话,讨论如何基于 Claude 构建 Genspark。Genspark 将自己定位为一个基于 Claude 的一体化 AI 工作空间(all-in-one AI workspace)。这段对话展示了 AI 厂商与其模型供应方之间技术合作的一个具体案例,并强调了正如官方推文所说,“合适的 AI 合作伙伴关系能改变一切”。

🔗 Genspark × Anthropic 访谈


Cohere Command A+ 已在 Azure AI Foundry 上提供

5 月 22 日 — 在开源发布两天后(5 月 20 日),Cohere Command A+ 已作为 Microsoft Azure AI Foundry 中的 Managed Compute 产品提供。该模型(MoE 架构,218B/25B,Apache 2.0 许可)为 Azure 客户带来:推理、多语言能力(48 种语言)、多模态理解、RAG、代码和 tool use。这是 Command A+ 发布后宣布的首个重大云集成。

🔗 Azure 公告 — Cohere Command A+


简讯

  • Google DeepMind × 新加坡 — Google DeepMind 正在扩大与新加坡的合作伙伴关系,以在三个领域大规模部署 AI:科学发现、疫情准备和医疗保健改善。🔗 来源

这意味着什么

网络安全进入了吞吐时代。 Project Glasswing 的数字(一个月内 10,000+ 个关键漏洞)不仅仅代表技术性能——它们改变了问题的结构。漏洞检测不再是瓶颈:跟不上的已经变成修复本身。这个反转给软件安全行业提出了一个前所未有的问题:如何以只有 AI 才能达到的速度,将补丁管理工业化?Perplexity 的 Bumblebee 和 Google DeepMind 的 SynthID 体现了同样的趋势——安全与来源可信度正在成为 AI 的基础设施层,而不是可选项。

Gartner MQ 企业 AI 编码代理描绘出新的层级。 GitHub Copilot(连续第 3 年)和 OpenAI Codex 同处 Leader 象限,意味着企业市场的竞争如今取决于完整的 SDLC,而不是自动补全的质量。Gartner 的预测——到 2028 年通过异步代理带来 30% 到 50% 的生产率提升——对仍在犹豫采用程度的 CIO 和 CTO 来说是一个强烈信号。GitHub CPO Mario Rodriguez 所描述的“分配任务,然后回来验证”范式,与其说是工具更新,不如说更接近组织变革。

工业 AI 正成为战略差异化的一个轴心。 Mistral 收购 Emmi AI,使这家法国公司站到了一个美国大型平台尚未饱和的细分领域:面向航空航天、汽车和半导体的实时物理仿真。Azure Foundry 上的 Cohere Command A+ 以及 DeepSeek V4-Pro 的永久折扣,说明了另一种并行趋势——API 价格压力正在变成结构性问题,而想要在企业市场生存的参与者,要么降低接入成本,要么在垂直增值上做深。Mistral 选择了后者。

CLI 代理生态正在快速整合。 Gemini CLI 0.43.0、Antigravity 2.0.6,以及本周发布的 Google I/O 开发者回顾,都表明 Google 正在围绕 Antigravity 构建一个一致性的生态——从终端到 IDE,再到 SDK 和云端。WebMCP 在 Chrome 149 中进入 origin trial 值得关注:如果这个开放标准在向浏览器代理暴露工具方面站稳脚跟,它可能会成为代理市场中不同参与者之间关键的互操作层。


来源