Anthropic 提交 IPO 申请，NVIDIA 发布 Cosmos 3，MiniMax M3 和 Qwen3.7-Plus

2026年6月1日将成为近代 AI 历史上最密集的日子之一：Anthropic 通过向 SEC 提交保密 S-1 申请向上市迈进一步，与此同时，一波“Physical AI”浪潮同步席卷而来——NVIDIA Cosmos 3、Cosmos Coalition Runway+NVIDIA、Luma OPAL Lab、MiniMax M3、Qwen-VLA 和 Qwen3.7-Plus。与此同时，OpenAI 推出用于大流行准备的 Rosalind Biodefense，并发布与加州 TFAIA 和《欧盟 AI 法案》对齐的治理框架。

Anthropic 向 SEC 保密提交 S-1 表格

6月1日 — Anthropic 已向美国证券交易委员会（SEC）保密提交一份 S-1 注册草案，拟进行普通股首次公开募股（IPO）。这项保密提交是必须的初步步骤，允许 SEC 在任何公开发行之前审阅该文件。

项目	值
提交类型	保密 S-1 表格
监管机构	SEC（美国）
股份类型	普通股
价格 / 股数	尚未确定
法律状态	初步提交 — 不是出售要约
日期	2026年6月1日

公告指出，Anthropic 保留在 SEC 审查完成后上市的选择，但最终交易将取决于市场状况和其他因素。这份 S-1 提交紧随 C 轮融资完成之后（650亿美元，融资后估值 9650 亿美元），以及据称在 2026年5月中旬已超过 470亿美元的年化收入。

Anthropic 仍是一家公益公司（PBC — Public Benefit Corporation），并计划在可能上市后继续保持这一 статус——这是一种罕见的法律区分，要求在追求利润之外兼顾公共利益义务。

🔗 官方公告 — Anthropic

NVIDIA Cosmos 3 — 首个用于 Physical AI 的开源 omni 模型

6月1日 — NVIDIA 发布 Cosmos 3，这是首个完全开放的物理 AI omni 模型。它将语言、图像、视频、音频和动作生成统一到单一模型中——这是全球首次。

变体	参数量	可用性
Cosmos 3 Super	32B	发布即开源
Cosmos 3 Nano	8B	发布即开源

该模型原生集成视觉推理（native vision reasoning）、世界生成（world generation）和动作生成（action generation）。据 Artificial Analysis 报告，Cosmos 3 在发布当天即在文本到图像和图像到视频生成领域位居 开源权重模型第 #1。权重已在 Hugging Face 和 NVIDIA NGC 上提供。

“Introducing Cosmos 3: Our latest frontier model for Physical AI. Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.”

🇨🇳 NVIDIA 推出 Cosmos 3：其最新的物理 AI 前沿模型。Cosmos 3 是全球首个完全开放的 omni 模型，具备原生视觉推理、世界生成和动作生成能力。 — @NVIDIAAI 在 X 上

Cosmos Coalition — Runway + NVIDIA，面向 world models 的全球倡议

6月1日 — Runway 加入 NVIDIA，成为 Cosmos Coalition 的创始成员。这是一项汇聚顶尖 AI 实验室、共同构建并以开源方式提供面向物理 AI 的 frontier world models 的全球倡议。

其目标是创建一个开放的共享生态系统，使任何研究或工业团队都能使用、修改并组合这些模型，用于生产工作系统。该联盟还纳入了与芯片和硬件制造商的合作伙伴关系。

“Introducing the Cosmos Coalition. A new global initiative with NVIDIA and leading AI labs to build and open-source frontier world models for physical AI.”

🇨🇳 Cosmos Coalition 亮相。这是一项由 NVIDIA 和主要 AI 实验室共同参与的新全球倡议，旨在构建并以开源方式提供面向物理 AI 的前沿 world models。 — @runwayml 在 X 上

这次与 Cosmos 3 协同推出的发布标志着一个战略转折点：NVIDIA 正将开源物理 AI 定位为全球技术主权议题，以应对资源集中在少数封闭参与者手中的局面。

MiniMax M3 — 首个同时结合前沿 coding、多模态和 1M 上下文的 open-weight 模型

6月1日 — MiniMax 发布 M3，这是首个同时融合三项前沿能力的 open-weight 模型。几小时内获得 170 万次浏览，成为今年最受关注的开源发布之一。

能力	细节
Coding & Agentic frontier	59.0% SWE-Bench Pro，66.0% Terminal Bench 2.1
1M tokens 上下文	MiniMax Sparse Attention
原生多模态	从训练第零阶段开始

完整基准：

基准	分数
SWE-Bench Pro	59.0%
Terminal Bench 2.1	66.0%
SWE-fficiency	34.8%
KernelBench Hard	28.8%
MCP Atlas	74.2%
BU Bench (browser use)	相较前一版 +26%

M3 从设计之初就面向计算机使用代理（computer-use agents）和长时程 agentic 工作流。权重和技术报告将在发布后约 10 天内公布。一个专用 IDE，MiniMax Code，也同步发布，可访问 code.minimax.io。首发合作伙伴包括 Qubrid AI（GPU 云基础设施）和 Simular（自治代理）。

🔗 MiniMax M3 公告

Luma OPAL Lab — 面向通用机器人技术的开放式 Physical AI 实验室

6月1日 — Luma 宣布创建 OPAL Lab（Open Science Physical AI Lab），这是一个专注于机器人泛化能力的开放研究实验室。

创始人 Amit（@gravicle）指出了当前物理 AI 的核心问题：与能够在全新任务上实现泛化的大型语言模型不同，机器人只能在特定环境中重复特定任务。机器人技术面临数据不足，导致一场 泛化危机。

“We are launching Open Physical AI Lab at Luma to solve generalization in robotics. We believe general physical AI is the most consequential problem to solve to improve life on Earth.”

🇨🇳 我们在 Luma 启动 Open Physical AI Lab，以解决机器人泛化问题。我们认为，通用物理 AI 是改善地球生活最关键、最需要解决的问题。 — @gravicle 在 X 上

Luma 依托于 4 年的多模态 AI 基础研究（3D、图像、视频、统一生成）以及互联网规模的多模态数据处理基础设施。OPAL Lab 的原则包括：开放科学、方法与底层资源对所有人开放、与学术界合作、产业合作，以及安全评估。其信息明确带有政治意味：将全球物理智能基础设施集中在少数公司手中，对人类构成深层威胁。

🔗 OPAL Lab 公告

Qwen3.7-Plus — 阿里巴巴具备视觉、编程与长上下文的多模态 agent

6月1日 — 阿里巴巴通义实验室发布 Qwen3.7-Plus，这是其最先进的多模态 agent 模型。它建立在 Qwen3.7 文本骨干之上，将视觉与语言融合为一个统一且通用的 agent 基础。

关键基准：

基准	Qwen3.7-Plus	GPT-5.4	Claude Opus 4.6 Max	Gemini 3.1 Pro
Terminal Bench 2.0	70.3	—	65.4	—
SWE-bench Verified	77.7	—	80.8	—
GPQA Diamond	90.3	—	91.3	—
ScreenSpot Pro	79.0	67.4	49.5	68.1
AndroidWorld	81.0	—	62.0	70.7
BabyVision	70.4	53.1	12.6	55.9

四项核心能力：混合式 GUI+CLI agent（感知屏幕、在应用中导航）、编程助手与多模态生产力（从前端原型到复杂工程）、视觉 agent（感知、推理、定位以及由网页搜索增强的问答），以及通过 Claude Code、OpenClaw、Qwen Code 或其他任意 agent 环境实现的跨环境泛化。

可用性： Alibaba Cloud Model Studio、兼容 OpenAI 的 API 以及 Anthropic 协议（可通过 ANTHROPIC_BASE_URL 直接与 Claude Code 一起使用）。

🔗 Qwen3.7-Plus 博客

Rosalind Biodefense — OpenAI 向防御性生物学开放 GPT-Rosalind

5月29日 — OpenAI 宣布围绕防御性生物学推出两项重大举措，依托其专为生命科学设计的推理模型 GPT-Rosalind。

组织	领域	类型
Fourth Eon	生物安全筛查、DNA 合成	Rosalind Biodefense 开发者
SecureDNA	生物安全	Rosalind Biodefense 开发者
Lawrence Livermore National Laboratory	医疗对抗措施	政府合作伙伴
Johns Hopkins APL	蛋白工程、治疗药物	政府合作伙伴
CEPI	大流行疫苗、埃博拉应对	政府合作伙伴

Rosalind Biodefense 是一个面向学术机构、非营利组织、防御性使命企业和政府团队的开放开发计划。OpenAI 为 GPT-Rosalind 的接入提供资金支持，并协助推进流行病建模、早期检测、筛查、大流行准备以及医疗对抗措施相关项目。

“Advances in biology can strengthen our ability to prevent, detect, and respond to biological threats. Our goal is to help build a more robust ecosystem — giving trusted defenders frontier AI to develop and operate new defenses for public health and biodefense.”

🇨🇳 生物学进展可以增强我们预防、检测和应对生物威胁的能力。我们的目标是帮助构建一个更强健的生态系统——为值得信赖的防御者提供前沿 AI，用于开发和运行面向公共卫生与生物防御的新防线。 — @OpenAI 在 X 上

同时宣布将 GPT-Rosalind 扩大提供给美国及盟友政府合作伙伴，其中包括在其“100 天”疫苗加速使命框架下的 CEPI——包括对当前埃博拉疫情的应对。

🔗 Rosalind Biodefense — OpenAI

Claude Code v2.1.153 到 v2.1.159 — 28日后五次更新

5月29日 – 6月1日 — Anthropic 在 Opus 4.8 发布后的几天内发布了五个 Claude Code 版本。

版本	关键点
2.1.153	marketplace 的 `skipLfs` 选项，`claude doctor` 改进，macOS/Windows 的 MCP/agents 修复
2.1.156	关键修复——Opus 4.8 中的 thinking blocks 会导致 API 错误
2.1.157	从 `.claude/skills/` 自动加载插件，`plugin init` 命令，`EnterWorktree` 会话中切换
2.1.158	为 Opus 4.7 和 Opus 4.8 在 Bedrock、Vertex 和 Foundry 上启用 Auto Mode（`CLAUDE_CODE_ENABLE_AUTO_MODE=1`）
2.1.159	内部基础设施，无可见变更

2.1.157 版本最值得关注：放在 .claude/skills/ 中的插件现在无需经过 marketplace 即可自动加载，并且 EnterWorktree 可在会话过程中切换由 Claude 管理的 worktrees。2.1.158 版本将 Auto Mode 带到主要云平台，强化了 Claude Code 的企业级部署。

🔗 Claude Code 发布

Gemini 3.5 Flash 和 Gemini Omni 正式可用

5月29日 — Google 通过 9 段视频演示标志着 Gemini 3.5 Flash 的正式可用（general availability），展示了 Gemini Omni 和 Gemini 3.5 Flash 的实际运行。

Gemini 3.5 Flash 部署： Gemini 应用和 Search 的 AI Mode 中的默认模型（全球范围），可通过 Google Antigravity、Google AI Studio 中的 Gemini API、Android Studio、Gemini Enterprise Agent Platform 和 Gemini Enterprise 使用。

Gemini Spark： 由 Gemini 3.5 驱动的 24 小时个人 AI agent，现已向美国所有 Google AI Ultra 订阅者开放，并集成到 Gmail、Docs、Slides 和 Workspace 中。

Gemini Omni Flash： 已向 Google AI Plus、Pro 和 Ultra 订阅者在 Gemini 应用和 Google Flow 中推出；YouTube Shorts 和 YouTube Create App 用户可免费使用；开发者 API 将在随后几周推出。

🔗 Gemini Omni 和 3.5 Flash 演示

Qwen-VLA — 面向 11 种机器人类型的视觉-语言-动作 agent

5月29日 — 通义实验室发布 Qwen-VLA，这是一个统一的 Vision-Language-Action（VLA）模型，用于通用具身智能（general embodied intelligence）。

架构： Qwen3.5-4B（语言-视觉骨干）+ 1.15B DiT 解码器，可直接从视觉感知和自然语言生成动作。该模型将物体操控、空间导航和轨迹预测统一到一个框架中。

借助具身感知提示（embodiment-aware prompts），同一模型可在 11 种机器人具身形态 上运行——单臂、双臂和人形平台——无需 policy heads 或针对任务的专用架构。该推文在两天内获得 310 万次浏览，显示出机器人社区的巨大兴趣。

🔗 X 上的 Qwen-VLA

Copilot — 指标 API 增加了 AI 采用队列

5月29日 — GitHub 为 Copilot 使用指标 API 增加了一个 AI 采用队列系统。每位活跃用户都会被归入以下四个阶段之一，按 28 天滚动窗口计算：

阶段	名称	标准
0	No cohort	参与度不足
1	Code first	代码补全和/或 IDE 代理模式
2	Agent first	一个 GitHub 代理界面（云端代理、代码审查、CLI）
3	Multi-agent	两个或以上代理界面，或 GitHub Copilot 应用

按阶段公开的指标包括：活跃用户、交互、代码生成与接受、增删行数、创建/合并/审查的 pull request、合并中位延迟。该功能面向企业管理员和组织所有者开放。这个系统可以衡量 Copilot 采用的真实成熟度，并跟踪开发者向更高级代理式用法的演进。

🔗 GitHub 更新日志 — Copilot 使用指标 API

ElevenLabs 与希腊政府签署 MOU

5月28日 — ElevenLabs 与希腊政府签署了一份谅解备忘录，希腊总理 (@PrimeministerGR) 和数字化转型部长 (@papastergiougr) 共同出席。合作围绕三个方向：通过语音 AI 改善公共服务获取、推动旅游业发展，以及保护希腊语言遗产。该政府合作体现了 ElevenLabs 进入欧洲公共部门的策略，即押注高曝光度的机构场景。

🔗 ElevenLabs 公告

Frontier Governance Framework — OpenAI 将其实践与 TFAIA 和 EU AI Act 对齐

5月28日 — OpenAI 发布了其 Frontier Governance Framework，这是一份公共治理文件，将内部的 Preparedness Framework 转化为具体的监管义务。主要对标对象：加州的 Transparency in Frontier AI Act（TFAIA）以及欧盟 AI Act 中面向通用人工智能的实践准则。

该框架覆盖以下领域的风险评估与缓解：网络攻击、CBRN（化学、生物、放射性、核）、有害操控以及失控风险。它还包括模型报告义务、事件管理、外部专家介入，以及更新机制。OpenAI 指出，Preparedness Framework 仍是其内部基础——其中某些实践已经超出现行法律要求。

🔗 Frontier Governance Framework

可信第三方评估指南 — 方法与需控制的五类偏差

5月29日 — OpenAI 发布了一份方法指南，用于对前沿 AI 模型进行严格的第三方评估。文件从一个判断出发：最初为聊天机器人设计的评估，已经不适用于能够使用工具并在长链路轨迹上行动的代理式系统。

该指南区分了评估需要支持的三类主张：能力引出（模型在最佳条件下能做什么）、防护稳健性（抵抗攻击的能力），以及系统间比较。一个核心概念是 “harness”（模型外部运行环境），其设计选择会实质性改变结果——OpenAI 以上下文压缩对 GPT-5.5 在多步骤网络安全评估中的表现影响为例进行说明。

文中识别出五种有效性偏差：reward hacking（钻空子）、拒绝掩盖真实能力、污染（记住基准测试）、有缺陷的问题（任务不可能或评分错误），以及 sandbagging（在被检测到的评估中故意表现不佳）。OpenAI 承诺向第三方评估者提供最大能力引导说明，并共享推理轨迹。

🔗 可信第三方评估指南 — OpenAI

Grok Imagine Extend — 连续视频扩展

5月29日 — Grok Imagine 推出 Extend，这是一项可基于现有视频或图像创建带平滑过渡的连续视频的功能。该功能可直接在 Grok Imagine 界面中使用。@imagine 账号发布的推文被 @grok 转发，并获得了 701,000 次观看。此次发布也与 Grok Build 以及 grok-build-0.1 API 一起，巩固了 Grok 的创意套件。

🔗 Grok Imagine Extend

Windows 上的 Codex Computer Use 与移动端控制

5月29日 — OpenAI 宣布，Codex 的“computer use”功能现已可在 Windows 上使用。该代理可以看到屏幕、点击并在 Windows 应用中输入文本，为原生测试、模拟器流程以及仅能通过图形界面访问的 bug 修复打开了道路。ChatGPT 移动应用同时加入了对 Codex 的 Windows 支持：可以在手机上启动、监控并控制任务，而工作会继续在电脑上进行。OpenAI 将此功能称为“早期体验”；该功能在欧洲经济区、英国和瑞士不可用。

🔗 Windows 上的 Codex Computer Use

简讯

Salesforce + Claude Code — Boris Cherny (@bcherny) 分享了一个关于 Claude Code 代理式使用的 Salesforce 经验：原本估计需要 231 天的迁移最终在 13 天内完成，21 个 endpoint 达到 100% 测试覆盖率，尽管 PR 数量增加，事故率仍下降了 5%。🔗 来源
Google I/O 2026 — AI 幕后制作 — Google 详细介绍了团队如何使用 Gemini Omni、Nano Banana、Lyria 3 和 Antigravity 为 Google I/O 2026 打造创意体验：动画短片、视觉识别、互动音乐预演和生成式游戏。🔗 来源
Gemini CLI v0.44.0 — 统一 Auto Mode（合并专用模式）、原生支持 Sublime Text 和 Emacs Client，以及新的可编程 TUI 测试工具。🔗 来源
GitHub Copilot — auto 模式中的评估模型 — 个人用户（Free、Pro、Pro+）现在可以通过自动选择 auto 访问预 GA 模型。可在设置中关闭该选项。🔗 来源
ElevenLabs 华沙峰会 — ElevenLabs 联合创始人 Mati 展示了该公司有史以来最具表现力的语音模型预览版。该内容仅为预览，尚未宣布向公众开放。🔗 来源
Cohere Command A+ — 翻译基准 — Command A+ 在 WMT24++ 上超过 Mistral Medium 3.5、DeepSeek、gpt-oss 和 Claude Opus 4.6，以及 Google Translate。已记录的提升：法语 +2.4 分、西班牙语 +1.9 分、德语 +0.9 分。🔗 来源

这意味着什么

Anthropic 的财务动向与行业整合。 Anthropic 的保密 S-1 文件是本周最具结构性的新消息。它出现在一个极其强劲的增长背景之下——H 轮融资 650 亿美元、估值接近万亿美元——并表明前沿 AI 巨头开始认真考虑公开市场。保留 PBC（Public Benefit Corporation）身份是一个强有力的承诺：Anthropic 试图证明，上市与长期安全使命可以并行不悖。这个先例将对 OpenAI 及其他可能走上这条道路的参与者产生影响。

Physical AI 浪潮——走向能在现实世界行动的 AI。 6月1日标志着围绕物理 AI 的显著汇聚：NVIDIA Cosmos 3（面向机器人与代理的首个 omni-model open-weight 模型）、Cosmos Coalition（Runway+NVIDIA 开放生态）、Luma OPAL Lab（机器人泛化的开放研究）、MiniMax M3（100 万上下文 + 原生多模态）、Qwen-VLA（在统一架构下支持 11 类机器人）以及 Qwen3.7-Plus（在界面中执行的 GUI+CLI 代理）。这一组发布并非巧合——它反映出越来越一致的共识：AI 的下一前沿是对物理空间的行动，而开源将在其中扮演核心角色。封闭模型与开放模型之间的竞争正在加剧，尤其是在机器人和 computer use 基准测试上。

AI 治理与安全开始进入实定法。 OpenAI 发布的 Frontier Governance Framework 与加州 TFAIA 和 EU AI Act 对齐；可信第三方评估指南也同步发布，这标志着一个阶段：大型 AI 公司不再只在内部定义规则。它们开始对齐具体立法并公开评估方法。Rosalind Biodefense 计划则展示了治理的另一面——让前沿 AI 服务于社会防御（流行病准备、生物安全），并配套适当控制。

开发者工具加速演进并走向分化。 Claude Code 在四天内发布了五个版本，包括 Bedrock/Vertex/Foundry 上的 Auto Mode，以及本地插件自动加载。Gemini CLI v0.44.0 统一了 Auto 模式并扩展了 IDE 集成。GitHub Copilot 则细化了其采用分类（4 个阶段、28 天窗口），帮助组织衡量其 AI 采用的真实成熟度。开发者如今拥有的是一套密集且快速变化的代理式工具链——问题不再是能否接触到模型，而是团队能否以一致、可衡量的方式将这些工具纳入工作流。