GLM-5.2 开源 MIT、Qwen-Robot Suite 与 NVIDIA Blackwell 主宰 MLPerf：2026年6月16日 AI 资讯

2026年6月16日 — Z.ai 发布 GLM-5.2 的开源 MIT 权重（100万 tokens 窗口、双级推理），Alibaba Qwen 公开了由三个面向机器人技术的基础模型组成的 Qwen-Robot Suite，NVIDIA Blackwell 横扫 MLPerf Training 6.0 的全部基准——其中包括在 8,192 个 GPU 上用 2.02 分钟训练完成的 DeepSeek-V3 671B。GitHub 宣布 Code Quality 将于 7 月 20 日以每位活跃开发者每月 $10 的价格进入付费一般可用（general availability），June Pixel Drop 为 Pixel 设备带来 Gemini Omni 视频与音乐生成功能，Anthropic 的经济研究则首次量化了行业专业知识对 Claude Code 的影响。

Z.ai GLM-5.2 — 开源 MIT 权重已开放

6月16日 — Z.ai（原 Zhipu AI）正式发布 GLM-5.2 的开源权重，采用 MIT 许可证，这兑现了 6 月 13 日的公告。权重现已可在公司平台下载。

“Introducing GLM-5.2: Frontier Intelligence, Open Weights

Significant improvements in coding and agentic tasks

Strong long-horizon capabilities with a 1M context window

Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance”

🇨🇳 推出 GLM-5.2：前沿智能，开放权重。编码与智能体任务显著增强。具备 100 万 token 的上下文窗口，长序列能力强大。两档推理力度：GLM-5.2（max）突破极限，而 GLM-5.2（high）则提供稳健平衡。 — @Zai_org 在 X 上

GLM-5.2 重点：

在编码（coding）和智能体任务上有显著提升
100 万 token 的上下文窗口——适用于大规模编码智能体与长文档处理
两档互补的推理力度
在编码、工具使用和推理方面超越 GLM-5.1
可通过 chat.z.ai 使用

变体	推理	上下文	许可证
GLM-5.2 (max)	最高性能	100万 tokens	MIT 开源
GLM-5.2 (high)	性能/速度的强平衡	100万 tokens	MIT 开源

MIT 许可证是最重要的标志：它允许无限制的商业使用，使 GLM-5.2 可直接被那些不能或不愿依赖美国专有模型的企业采用。该推文在数小时内获得了 51.5 万次浏览——这强烈表明社区对具备大上下文窗口的前沿开源模型有着浓厚兴趣。

🔗 Z.ai 博客 — GLM-5.2

Qwen-Robot Suite — 面向具身机器人的三个基础模型

6月16日 — Alibaba Qwen 发布 Qwen-Robot Suite，这是一个面向具身智能（embodied intelligence）的完整技术栈，由三个彼此独立又相互补充的基础模型组成：导航、操作和世界模型。

Qwen-RobotNav — 移动导航专家：

将 5 项任务统一为一个模型：指令跟随、目标点导航（point-goal）、目标物体导航（object-goal）、物体跟踪和自动驾驶
可控观测协议
面向智能体系统的工具接口

Qwen-RobotManip — 操作专家：

面向异构机器人的统一状态-动作空间
以相机坐标系表示的 delta 位姿，实现不同机器人躯体之间的一致学习（cross-embodiment）
在超过 38,100 小时的开源语料上预训练

Qwen-RobotWorld — 物理世界模型：

一个模型覆盖超过 20 种机器人躯体类型
自然语言动作接口
预测用于操作、驾驶和导航的物理约束未来

每个模型都可以独立使用，也可以作为物理世界中的一个工具进行组合。合在一起，它们构成了面向通用智能体系统的底层工具箱。

模型	专长	关键数据
Qwen-RobotNav	多任务导航（统一 5 项任务）	面向智能体系统的工具接口
Qwen-RobotManip	cross-embodiment 机器人操作	38,100+ 小时开源语料
Qwen-RobotWorld	物理 world model	20+ 种机器人躯体类型

🔗 Qwen-Robot Suite — 公告

NVIDIA Blackwell 主宰 MLPerf Training 6.0 — 全面横扫

6月16日 — NVIDIA 赢得了 MLPerf Training 6.0 的全部基准，这是由 MLCommons 联盟建立的 AI 训练行业标准。它是唯一在每一项测试中都提交结果的平台，其中包括本版本新增的两个基准：DeepSeek-V3（6710 亿参数，MoE 架构）和 GPT-OSS-20B。

GB300 NVL72 系统（72 个互联的 Blackwell Ultra GPU）的表现十分出色：

模型	平台	GPU	时间
DeepSeek-V3 671B (MoE)	GB300 NVL72	8 192	2.02 分钟
GPT-OSS 20B (MoE)	GB300 NVL72	512	7.43 分钟
Llama 3.1 405B	GB200 NVL72	8 192	7.07 分钟
Llama 3.1 8B	GB200 NVL72	1 024	4.46 分钟
Llama 2 70B LoRA	GB300 NVL72	512	0.40 分钟
FLUX.1（图像生成）	GB300 NVL72	512	17.1 分钟
DLRM-dcnv2	GB300 NVL72	64	0.67 分钟

FLUX.1（Black Forest Labs 的图像生成模型）被纳入官方基准测试值得注意：这证实了 Blackwell 基础设施是训练最先进图像生成模型的参考标杆。

在软件层面，NVIDIA 在 NeMo 26.06 栈中部署了多项创新：面向 MoE 的完整迭代 CUDA 图、通过 CuTe DSL 的内核融合、注意力块的 MXFP8 精度，以及 MoE 路由器优化（内核加速 5×）。这些软件改进在不改变硬件的情况下，三个月内使 DeepSeek-V3 吞吐量提升 1.3×，从 1,298 提升到 1,648 TFLOPS/GPU——这提醒人们，硬件性能只是方程式的一部分。

🔗 NVIDIA — MLPerf Training 6.0

June Pixel Drop 2026 — Gemini Omni 视频、音乐生成、Daily Brief

6月16日 — June Pixel Drop 2026 为 Pixel 设备引入了多项重大功能，将 Gemini 直接整合进设备中，并将在接下来的几周内逐步推送。

Gemini Omni — AI 视频创作与编辑：只需与 Gemini 自然对话，即可混合文本、图像和视频。你可以从零开始、对相册中的内容进行 remix、使用预设模型，甚至创建一个与用户外貌和声音一致的个性化 AI 头像。

Gemini 中的音乐生成：用户描述一个想法或导入一张照片，系统会将其转换为带歌词的原创音轨。风格、声音和节奏都可以在 Gemini 应用的“工具 → 创建音乐”菜单中自定义。

Daily Brief — AI 早晨智能体：面向所有 Google AI Plus、Pro 和 Ultra 订阅用户开放（18 岁以上，目前仅限美国）。该智能体会在用户醒来前整理好当天安排。实时翻译通话的 Voice Translate 也扩展到了 Pixel 10a（7 种语言，其中包括法语）。

功能	可用性	备注
Gemini Omni 视频	Pixel（逐步推送）	通过对话创作/remix
音乐生成	Pixel（Gemini 应用）	音频 + 歌词，可自定义
Daily Brief	Google AI Plus/Pro/Ultra，18+，美国	AI 早晨智能体
Voice Translate	Pixel 10a	7 种语言 + 印地语预览版
Edit with Ask Photos	英国、德国、法国、西班牙、意大利	通过对话编辑照片

🔗 June Pixel Drop 2026 — Google 官方博客

GitHub Code Quality — 7 月 20 日一般可用，$10 / 活跃开发者

6月16日 — GitHub 宣布 GitHub Code Quality 将于 2026年7月20日 从公开预览转为一般可用（general availability），并作为付费产品提供。已有超过 10,000 家公司参与了预览。

7 月 20 日定价：

组成部分	定价
每位活跃开发者（committer）许可证	$10 / 活跃开发者 / 月
AI 功能（Copilot code review、AI 检测、Copilot Autofix）	按使用量计费
CodeQL 确定性分析	GitHub Actions 分钟

GA 即可用的新功能：

组织级部署（一个管理员开关即可）
组织级质量仪表板
通过规则集（rulesets）强制执行代码覆盖率
按仓库和组织计算的质量评分
用于启用和管理结果的 API

**可用性：**仅限 GitHub Enterprise Cloud 和 GitHub Team。GitHub Enterprise Server 不提供。希望在计费前退出的客户可以在 7 月 20 日之前在其仓库中停用 Code Quality。

🔗 GitHub Code Quality — GA 公告

Anthropic 经济研究 — 行业专业知识胜过代码熟练度

6月16日 — Anthropic 发布了一项关于 Claude Code 使用情况的经济研究，基于对 2025 年 10 月至 2026 年 4 月约 40 万个会话的保密分析。首次量化了专业知识如何决定使用 AI 编码智能体的成败。

研究的关键结果（作者：Zoe Hitzig、Maxim Massenkoff、Eva Lyubich、Ryan Heller、Peter McCrory）：

指标	数值
分析会话数	~400 000
不同用户数	~235 000
覆盖时期	2025年10月 – 2026年4月
规划决策（用户）	~70 %
执行决策（Claude）	~80 %
任务平均经济价值提升	+25 %
验证成功率（行业专家）	28–33 %
验证成功率（新手）	15 %
调试会话占比（10月 → 4月）	33 % → 19 %

核心结论：在一次典型会话中，用户负责约 70% 的规划决策（做什么），而 Claude 负责约 80% 的执行决策（怎么做）。行业专家——不一定是开发者——能引导 Claude 执行长度长两倍、且每条指令内容多五倍的动作链。非技术职业（律师、管理者、科学家）的成功率与软件工程师相比相差不到 7 个百分点。决定成功的，是对业务问题的理解，而不是代码熟练度。

🔗 Anthropic 经济研究 — Claude Code

Anthropic 与 OpenAI — 生产环境中的智能体与欧洲部署

Claude Managed Agents — 生产落地指南

6月16日 — Anthropic 的 Applied AI 团队发布了一份关于使用 Claude Managed Agents 将智能体投入生产的实用指南。文章解释了交互界面的演进：从传统聊天机器人走向具备计划能力、持久化、并可访问运行环境（stateful runtime environments）的自主智能体。自 6 月 9 日起提供的两项功能：按既定计划运行智能体，以及将环境变量存储在保险库（vaults）中。

🔗 使用 Claude Managed Agents 构建

Claude Code v2.1.178 — 细粒度权限与嵌套 skills

6月15日 — Claude Code v2.1.178 为权限规则引入了 Tool(param:value) 语法——例如 Agent(model:opus) 用于阻止 Opus 子智能体。位于嵌套 .claude/skills/ 目录中的 skills 在处理这些文件夹时会自动加载。Auto mode 现在会在启动前由分类器评估子智能体启动请求，关闭了一个漏洞：此前子智能体可能在未经过预审的情况下请求被阻止的操作。

🔗 Claude Code v2.1.178

Codex 应用登陆 EEA、英国和瑞士 — Computer Use、Memories、Chronicle

6月16日 — OpenAI 将 Codex 的四项高级功能部署到欧洲经济区（EEE）、英国和瑞士：Computer Use（macOS + Windows）、Chrome Codex 扩展、Memories 和 Chronicle。

Computer Use 让 Codex 能与桌面应用交互——查看、点击、输入文本。Chrome 扩展可执行需要已连接浏览器上下文的任务，并在多个标签页后台工作。Memories 会记住重复出现的仓库偏好和约定，但在这三个地区默认关闭，以符合监管要求。Chronicle 是仅面向 Pro 订阅者、且仅限 macOS 的 opt-in 预览功能，可帮助 Codex 基于屏幕近期上下文构建记忆。这些功能此前已向 EEA/UK/CH 之外的 Enterprise 用户开放。

🔗 OpenAI — Codex EEA/UK/瑞士部署

OpenAI 部署模拟——在发布前预测行为

6月16日——OpenAI 发布其 Deployment Simulation（部署模拟）方法：将先前部署中真实的匿名对话与候选模型一起重放，以便在投入生产前检测不良行为。该方法在 GPT-5-series Thinking 部署上进行了测试（约 130 万次对话），预测中位误差为 1.5×，明显优于合成评估。该方法还帮助在 GPT-5.1 发布前检测到了“calculator hacking”（一种形式的 reward hacking，奖励黑客行为）。

🔗 Deployment Simulation — OpenAI

Codex CLI 0.140.0——`/usage`、`/import` 来自 Claude Code，Bedrock 认证

6月15日——Codex CLI 的 0.140.0 版本带来了多项实质性功能。/usage 可显示账户按日、按周以及累计的 token 活动情况。/import 允许从 Claude Code 中有选择地导入配置、项目参数和最近的对话——这实现了两个竞争工具之间的直接互操作。codex delete 会在确认安全提示并清理关联子代理后，永久删除一个会话。受管理的 Amazon Bedrock 认证会将 API 密钥以加密方式本地存储，并且也支持 MCP 的 OAuth 凭据。与此同时，MCP 可靠性修复（针对临时启动失败的重试）以及损坏 SQLite 数据库的自动恢复也已加入。

🔗 Codex CLI 0.140.0 — GitHub 发布

Meta AI——Facebook 上的 AI 模式与 Muse Spark

6月16日——Meta 正在 Facebook 上推出新的人工智能工具。AI Mode 是一个由 Meta AI 驱动的新搜索模式（由 Muse Spark 提供支持），它将答案锚定在用户在 Meta 应用上公开分享的内容——群组、Reels——从而提供有上下文的观点，而不是泛泛的搜索结果。可从动态消息或搜索中访问。

新的创意工具包括：从相册中基于拼贴模板的分享建议（cutout templates）、视频转场效果、可虚拟更换衣服和发型的照片预设（photo presets），以及在 Stories 中虚拟穿上运动球衣的 “Wear It” 选项。所有这些功能都为可选启用并可关闭。

🔗 Meta——Facebook 上的新 AI 工具

NVIDIA SpatialClaw——无需训练的空间推理代理

6月16日——NVIDIA Research 发布 SpatialClaw，这是一个无需额外训练的视觉空间推理代理（training-free，免训练）。代理不再调用一组固定的预定义工具，而是直接在持久内核中编写 Python，动态组合感知模块，并在各个步骤中修正自己的策略。输出会变成可与 NumPy 和 SciPy 重用的 Python 变量。

结果：在 20 个视觉空间推理基准上，相比最近的前代代理提升 +11.2 分；这一改进在 6 种不同模型架构上都保持一致，而且无需针对某个基准进行专门微调。

🔗 SpatialClaw — @NVIDIAAI 在 X 上

Cohere——美国限制 Anthropic 后需求涌入

6月15日——加拿大生成式 AI 公司 Cohere 表示，随着美国限制访问 Anthropic 的指令发布（6月13日已报道），公司收到了大量来自寻求替代方案企业的来向请求（inbounds）。该公司以引用 Polymarket 的推文幽默回应：“The world needs more Canada 🇨🇦”。这条推文获得了 5.6 万次浏览和 797 个赞。这一定位印证了美国指令为非美国主权供应商创造了直接商业机会。

🔗 Cohere——推文

GitHub Models 面向新客户下架

6月16日——GitHub 宣布将逐步撤下 GitHub Models。自 6 月 16 日起，新客户（此前没有使用记录的组织和企业）将不再能访问该服务，无论是免费套餐还是付费套餐。当前已有活跃使用的客户暂时不受影响，仍可继续使用 playground、API 以及可用模型。GitHub 表示，完整关闭的详细时间表将稍后公布。对于需要 AI 模型访问的新项目，GitHub 将引导至 Azure AI Foundry，后者提供更广泛的模型目录。

🔗 GitHub Models retirement

简讯

Claude Code v2.1.179——9 项稳定性修复（6月16日）：保留流式传输过程中的连接中断（mid-stream）、修复 Windows Terminal 和 VS Code 中 WSL2 的鼠标滚轮滚动问题（自 v2.1.172 起的回归），修复大型目录树上的 Linux 沙盒问题。🔗 v2.1.179
Gemini Trusted Tester Program——开放报名：Google 开放少量名额，邀请希望在公开发布前测试尚未发布 Gemini 功能的高级用户参与。🔗 报名
Gemini——70+ 语言的多语言麦克风（Android 和 iOS）：麦克风图标现已支持 70 多种语言，并可自由混用而无需更改设置。通过 @joshwoodward（Gemini App 产品总监）宣布。
GitHub Code Quality——组织一键启用（6月16日）：组织管理员可以在安全设置中通过一个开关，对所有仓库启用或停用 Code Quality。🔗 更新日志
Copilot 使用指标——通过服务器遥测增强（6月15日）：Copilot Enterprise 使用报告现在整合了服务器端检测到的活跃用户（除了客户端遥测之外），从而提升了每日和 28 天报告中 DAU 的覆盖率。🔗 更新日志
Manus——执行期间的消息队列（6月16日）：Manus 现在允许在任务进行中，将要发送给代理的消息排入队列。消息会在当前任务结束后按顺序处理。🔗 公告
ChatGPT iOS 1.2026.160（6月15日）：工作区文件浏览器、文件夹选择器、差异对比控件、通过聊天或全局进行 MCP 批准，以及消息和 Codex 计划中的 LaTeX 渲染。

这意味着什么

GLM-5.2 的 MIT 开源权重，以及三款 Qwen-Robot Suite 机器人模型，体现了中国开源供给在美国厂商仍大多保持专有的赛道上正在加速。GLM-5.2 以其 100 万 token 上下文窗口和 MIT 许可，直接成为那些寻求主权替代方案企业的商业模型竞争者——这正是美国限制 Anthropic 访问的指令让其在战略上变得清晰可见的赛道，而 Cohere 报告的需求涌入也印证了这一点。机器人领域是这场竞争的下一个战场：Qwen-Robot Suite 提供了完整的 navigation-manipulation-world model 技术栈，而 NVIDIA Research 的 SpatialClaw 则表明，无需 fine-tuning 也能实现高级空间推理——这两种互补路径共同勾勒出下一代代理式机器人系统的架构。

在硬件层面，MLPerf Training 6.0 的结果确认了 Blackwell 架构在工业规模上的主导地位：在 8,192 张 GPU 上用 2 分钟训练 DeepSeek-V3（6710 亿参数），这不是学术炫技，而是真实部署在云数据中心中的生产能力。三个月内在不更换硬件的情况下将 DeepSeek-V3 吞吐量提升 1.3× 的软件改进提醒我们，AI 性能竞赛既是软件栈（NeMo、CuTe DSL、MXFP8）的竞争，也是芯片的竞争——而这种动态会进一步强化既有的强势地位。

Anthropic 关于 Claude Code 的经济研究提供了一个重要且反直觉的视角：领域专业知识（法律、管理、科学）对与编码代理合作的成功几乎与代码本身的掌握程度同样重要。经验证的成功率显示，工程师与其领域内的非开发专家之间仅相差 7 个百分点。对于产品团队而言，这是一个结构性信息：AI 编码工具的目标用户不再只是开发者，接口设计也必须考虑这一点。

在开发者工具方面，6 月 16 日集中释放出多个相互呼应的信号：GitHub Code Quality 的付费 GA（$10/活跃开发者）、Codex 在 EEA/UK/瑞士提供 Computer Use、Claude Code v2.1.178 的细粒度权限，以及 OpenAI 的 Deployment Simulation 方法。代码质量与部署安全正从研究议题走向收费产品——这反映了开发团队 AI 工具市场日益成熟的趋势。