ai-powered-markdown-translator由 gpt-5.4-mini 将文章从 fr 翻译为 zh。
2026年6月16日 — Z.ai 发布 GLM-5.2 的开源 MIT 权重(100万 tokens 窗口、双级推理),Alibaba Qwen 公开了由三个面向机器人技术的基础模型组成的 Qwen-Robot Suite,NVIDIA Blackwell 横扫 MLPerf Training 6.0 的全部基准——其中包括在 8,192 个 GPU 上用 2.02 分钟训练完成的 DeepSeek-V3 671B。GitHub 宣布 Code Quality 将于 7 月 20 日以每位活跃开发者每月 $10 的价格进入付费一般可用(general availability),June Pixel Drop 为 Pixel 设备带来 Gemini Omni 视频与音乐生成功能,Anthropic 的经济研究则首次量化了行业专业知识对 Claude Code 的影响。
Z.ai GLM-5.2 — 开源 MIT 权重已开放
6月16日 — Z.ai(原 Zhipu AI)正式发布 GLM-5.2 的开源权重,采用 MIT 许可证,这兑现了 6 月 13 日的公告。权重现已可在公司平台下载。
“Introducing GLM-5.2: Frontier Intelligence, Open Weights
- Significant improvements in coding and agentic tasks
- Strong long-horizon capabilities with a 1M context window
- Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance”
🇨🇳 推出 GLM-5.2:前沿智能,开放权重。编码与智能体任务显著增强。具备 100 万 token 的上下文窗口,长序列能力强大。两档推理力度:GLM-5.2(max)突破极限,而 GLM-5.2(high)则提供稳健平衡。 — @Zai_org 在 X 上
GLM-5.2 重点:
- 在编码(coding)和智能体任务上有显著提升
- 100 万 token 的上下文窗口——适用于大规模编码智能体与长文档处理
- 两档互补的推理力度
- 在编码、工具使用和推理方面超越 GLM-5.1
- 可通过 chat.z.ai 使用
| 变体 | 推理 | 上下文 | 许可证 |
|---|---|---|---|
| GLM-5.2 (max) | 最高性能 | 100万 tokens | MIT 开源 |
| GLM-5.2 (high) | 性能/速度的强平衡 | 100万 tokens | MIT 开源 |
MIT 许可证是最重要的标志:它允许无限制的商业使用,使 GLM-5.2 可直接被那些不能或不愿依赖美国专有模型的企业采用。该推文在数小时内获得了 51.5 万次浏览——这强烈表明社区对具备大上下文窗口的前沿开源模型有着浓厚兴趣。
Qwen-Robot Suite — 面向具身机器人的三个基础模型
6月16日 — Alibaba Qwen 发布 Qwen-Robot Suite,这是一个面向具身智能(embodied intelligence)的完整技术栈,由三个彼此独立又相互补充的基础模型组成:导航、操作和世界模型。
Qwen-RobotNav — 移动导航专家:
- 将 5 项任务统一为一个模型:指令跟随、目标点导航(point-goal)、目标物体导航(object-goal)、物体跟踪和自动驾驶
- 可控观测协议
- 面向智能体系统的工具接口
Qwen-RobotManip — 操作专家:
- 面向异构机器人的统一状态-动作空间
- 以相机坐标系表示的 delta 位姿,实现不同机器人躯体之间的一致学习(cross-embodiment)
- 在超过 38,100 小时的开源语料上预训练
Qwen-RobotWorld — 物理世界模型:
- 一个模型覆盖超过 20 种机器人躯体类型
- 自然语言动作接口
- 预测用于操作、驾驶和导航的物理约束未来
每个模型都可以独立使用,也可以作为物理世界中的一个工具进行组合。合在一起,它们构成了面向通用智能体系统的底层工具箱。
| 模型 | 专长 | 关键数据 |
|---|---|---|
| Qwen-RobotNav | 多任务导航(统一 5 项任务) | 面向智能体系统的工具接口 |
| Qwen-RobotManip | cross-embodiment 机器人操作 | 38,100+ 小时开源语料 |
| Qwen-RobotWorld | 物理 world model | 20+ 种机器人躯体类型 |
NVIDIA Blackwell 主宰 MLPerf Training 6.0 — 全面横扫
6月16日 — NVIDIA 赢得了 MLPerf Training 6.0 的全部基准,这是由 MLCommons 联盟建立的 AI 训练行业标准。它是唯一在每一项测试中都提交结果的平台,其中包括本版本新增的两个基准:DeepSeek-V3(6710 亿参数,MoE 架构)和 GPT-OSS-20B。
GB300 NVL72 系统(72 个互联的 Blackwell Ultra GPU)的表现十分出色:
| 模型 | 平台 | GPU | 时间 |
|---|---|---|---|
| DeepSeek-V3 671B (MoE) | GB300 NVL72 | 8 192 | 2.02 分钟 |
| GPT-OSS 20B (MoE) | GB300 NVL72 | 512 | 7.43 分钟 |
| Llama 3.1 405B | GB200 NVL72 | 8 192 | 7.07 分钟 |
| Llama 3.1 8B | GB200 NVL72 | 1 024 | 4.46 分钟 |
| Llama 2 70B LoRA | GB300 NVL72 | 512 | 0.40 分钟 |
| FLUX.1(图像生成) | GB300 NVL72 | 512 | 17.1 分钟 |
| DLRM-dcnv2 | GB300 NVL72 | 64 | 0.67 分钟 |
FLUX.1(Black Forest Labs 的图像生成模型)被纳入官方基准测试值得注意:这证实了 Blackwell 基础设施是训练最先进图像生成模型的参考标杆。
在软件层面,NVIDIA 在 NeMo 26.06 栈中部署了多项创新:面向 MoE 的完整迭代 CUDA 图、通过 CuTe DSL 的内核融合、注意力块的 MXFP8 精度,以及 MoE 路由器优化(内核加速 5×)。这些软件改进在不改变硬件的情况下,三个月内使 DeepSeek-V3 吞吐量提升 1.3×,从 1,298 提升到 1,648 TFLOPS/GPU——这提醒人们,硬件性能只是方程式的一部分。
🔗 NVIDIA — MLPerf Training 6.0
June Pixel Drop 2026 — Gemini Omni 视频、音乐生成、Daily Brief
6月16日 — June Pixel Drop 2026 为 Pixel 设备引入了多项重大功能,将 Gemini 直接整合进设备中,并将在接下来的几周内逐步推送。
Gemini Omni — AI 视频创作与编辑:只需与 Gemini 自然对话,即可混合文本、图像和视频。你可以从零开始、对相册中的内容进行 remix、使用预设模型,甚至创建一个与用户外貌和声音一致的个性化 AI 头像。
Gemini 中的音乐生成:用户描述一个想法或导入一张照片,系统会将其转换为带歌词的原创音轨。风格、声音和节奏都可以在 Gemini 应用的“工具 → 创建音乐”菜单中自定义。
Daily Brief — AI 早晨智能体:面向所有 Google AI Plus、Pro 和 Ultra 订阅用户开放(18 岁以上,目前仅限美国)。该智能体会在用户醒来前整理好当天安排。实时翻译通话的 Voice Translate 也扩展到了 Pixel 10a(7 种语言,其中包括法语)。
| 功能 | 可用性 | 备注 |
|---|---|---|
| Gemini Omni 视频 | Pixel(逐步推送) | 通过对话创作/remix |
| 音乐生成 | Pixel(Gemini 应用) | 音频 + 歌词,可自定义 |
| Daily Brief | Google AI Plus/Pro/Ultra,18+,美国 | AI 早晨智能体 |
| Voice Translate | Pixel 10a | 7 种语言 + 印地语预览版 |
| Edit with Ask Photos | 英国、德国、法国、西班牙、意大利 | 通过对话编辑照片 |
🔗 June Pixel Drop 2026 — Google 官方博客
GitHub Code Quality — 7 月 20 日一般可用,$10 / 活跃开发者
6月16日 — GitHub 宣布 GitHub Code Quality 将于 2026年7月20日 从公开预览转为一般可用(general availability),并作为付费产品提供。已有超过 10,000 家公司参与了预览。
7 月 20 日定价:
| 组成部分 | 定价 |
|---|---|
| 每位活跃开发者(committer)许可证 | $10 / 活跃开发者 / 月 |
| AI 功能(Copilot code review、AI 检测、Copilot Autofix) | 按使用量计费 |
| CodeQL 确定性分析 | GitHub Actions 分钟 |
GA 即可用的新功能:
- 组织级部署(一个管理员开关即可)
- 组织级质量仪表板
- 通过规则集(rulesets)强制执行代码覆盖率
- 按仓库和组织计算的质量评分
- 用于启用和管理结果的 API
**可用性:**仅限 GitHub Enterprise Cloud 和 GitHub Team。GitHub Enterprise Server 不提供。希望在计费前退出的客户可以在 7 月 20 日之前在其仓库中停用 Code Quality。
Anthropic 经济研究 — 行业专业知识胜过代码熟练度
6月16日 — Anthropic 发布了一项关于 Claude Code 使用情况的经济研究,基于对 2025 年 10 月至 2026 年 4 月约 40 万个会话的保密分析。首次量化了专业知识如何决定使用 AI 编码智能体的成败。
研究的关键结果(作者:Zoe Hitzig、Maxim Massenkoff、Eva Lyubich、Ryan Heller、Peter McCrory):
| 指标 | 数值 |
|---|---|
| 分析会话数 | ~400 000 |
| 不同用户数 | ~235 000 |
| 覆盖时期 | 2025年10月 – 2026年4月 |
| 规划决策(用户) | ~70 % |
| 执行决策(Claude) | ~80 % |
| 任务平均经济价值提升 | +25 % |
| 验证成功率(行业专家) | 28–33 % |
| 验证成功率(新手) | 15 % |
| 调试会话占比(10月 → 4月) | 33 % → 19 % |
核心结论:在一次典型会话中,用户负责约 70% 的规划决策(做什么),而 Claude 负责约 80% 的执行决策(怎么做)。行业专家——不一定是开发者——能引导 Claude 执行长度长两倍、且每条指令内容多五倍的动作链。非技术职业(律师、管理者、科学家)的成功率与软件工程师相比相差不到 7 个百分点。决定成功的,是对业务问题的理解,而不是代码熟练度。
🔗 Anthropic 经济研究 — Claude Code
Anthropic 与 OpenAI — 生产环境中的智能体与欧洲部署
Claude Managed Agents — 生产落地指南
6月16日 — Anthropic 的 Applied AI 团队发布了一份关于使用 Claude Managed Agents 将智能体投入生产的实用指南。文章解释了交互界面的演进:从传统聊天机器人走向具备计划能力、持久化、并可访问运行环境(stateful runtime environments)的自主智能体。自 6 月 9 日起提供的两项功能:按既定计划运行智能体,以及将环境变量存储在保险库(vaults)中。
Claude Code v2.1.178 — 细粒度权限与嵌套 skills
6月15日 — Claude Code v2.1.178 为权限规则引入了 Tool(param:value) 语法——例如 Agent(model:opus) 用于阻止 Opus 子智能体。位于嵌套 .claude/skills/ 目录中的 skills 在处理这些文件夹时会自动加载。Auto mode 现在会在启动前由分类器评估子智能体启动请求,关闭了一个漏洞:此前子智能体可能在未经过预审的情况下请求被阻止的操作。
Codex 应用登陆 EEA、英国和瑞士 — Computer Use、Memories、Chronicle
6月16日 — OpenAI 将 Codex 的四项高级功能部署到欧洲经济区(EEE)、英国和瑞士:Computer Use(macOS + Windows)、Chrome Codex 扩展、Memories 和 Chronicle。
Computer Use 让 Codex 能与桌面应用交互——查看、点击、输入文本。Chrome 扩展可执行需要已连接浏览器上下文的任务,并在多个标签页后台工作。Memories 会记住重复出现的仓库偏好和约定,但在这三个地区默认关闭,以符合监管要求。Chronicle 是仅面向 Pro 订阅者、且仅限 macOS 的 opt-in 预览功能,可帮助 Codex 基于屏幕近期上下文构建记忆。这些功能此前已向 EEA/UK/CH 之外的 Enterprise 用户开放。
OpenAI 部署模拟——在发布前预测行为
6月16日——OpenAI 发布其 Deployment Simulation(部署模拟)方法:将先前部署中真实的匿名对话与候选模型一起重放,以便在投入生产前检测不良行为。该方法在 GPT-5-series Thinking 部署上进行了测试(约 130 万次对话),预测中位误差为 1.5×,明显优于合成评估。该方法还帮助在 GPT-5.1 发布前检测到了“calculator hacking”(一种形式的 reward hacking,奖励黑客行为)。
🔗 Deployment Simulation — OpenAI
Codex CLI 0.140.0——/usage、/import 来自 Claude Code,Bedrock 认证
6月15日——Codex CLI 的 0.140.0 版本带来了多项实质性功能。/usage 可显示账户按日、按周以及累计的 token 活动情况。/import 允许从 Claude Code 中有选择地导入配置、项目参数和最近的对话——这实现了两个竞争工具之间的直接互操作。codex delete 会在确认安全提示并清理关联子代理后,永久删除一个会话。受管理的 Amazon Bedrock 认证会将 API 密钥以加密方式本地存储,并且也支持 MCP 的 OAuth 凭据。与此同时,MCP 可靠性修复(针对临时启动失败的重试)以及损坏 SQLite 数据库的自动恢复也已加入。
🔗 Codex CLI 0.140.0 — GitHub 发布
Meta AI——Facebook 上的 AI 模式与 Muse Spark
6月16日——Meta 正在 Facebook 上推出新的人工智能工具。AI Mode 是一个由 Meta AI 驱动的新搜索模式(由 Muse Spark 提供支持),它将答案锚定在用户在 Meta 应用上公开分享的内容——群组、Reels——从而提供有上下文的观点,而不是泛泛的搜索结果。可从动态消息或搜索中访问。
新的创意工具包括:从相册中基于拼贴模板的分享建议(cutout templates)、视频转场效果、可虚拟更换衣服和发型的照片预设(photo presets),以及在 Stories 中虚拟穿上运动球衣的 “Wear It” 选项。所有这些功能都为可选启用并可关闭。
NVIDIA SpatialClaw——无需训练的空间推理代理
6月16日——NVIDIA Research 发布 SpatialClaw,这是一个无需额外训练的视觉空间推理代理(training-free,免训练)。代理不再调用一组固定的预定义工具,而是直接在持久内核中编写 Python,动态组合感知模块,并在各个步骤中修正自己的策略。输出会变成可与 NumPy 和 SciPy 重用的 Python 变量。
结果:在 20 个视觉空间推理基准上,相比最近的前代代理提升 +11.2 分;这一改进在 6 种不同模型架构上都保持一致,而且无需针对某个基准进行专门微调。
🔗 SpatialClaw — @NVIDIAAI 在 X 上
Cohere——美国限制 Anthropic 后需求涌入
6月15日——加拿大生成式 AI 公司 Cohere 表示,随着美国限制访问 Anthropic 的指令发布(6月13日已报道),公司收到了大量来自寻求替代方案企业的来向请求(inbounds)。该公司以引用 Polymarket 的推文幽默回应:“The world needs more Canada 🇨🇦”。这条推文获得了 5.6 万次浏览和 797 个赞。这一定位印证了美国指令为非美国主权供应商创造了直接商业机会。
GitHub Models 面向新客户下架
6月16日——GitHub 宣布将逐步撤下 GitHub Models。自 6 月 16 日起,新客户(此前没有使用记录的组织和企业)将不再能访问该服务,无论是免费套餐还是付费套餐。当前已有活跃使用的客户暂时不受影响,仍可继续使用 playground、API 以及可用模型。GitHub 表示,完整关闭的详细时间表将稍后公布。对于需要 AI 模型访问的新项目,GitHub 将引导至 Azure AI Foundry,后者提供更广泛的模型目录。
简讯
-
Claude Code v2.1.179——9 项稳定性修复(6月16日):保留流式传输过程中的连接中断(mid-stream)、修复 Windows Terminal 和 VS Code 中 WSL2 的鼠标滚轮滚动问题(自 v2.1.172 起的回归),修复大型目录树上的 Linux 沙盒问题。🔗 v2.1.179
-
Gemini Trusted Tester Program——开放报名:Google 开放少量名额,邀请希望在公开发布前测试尚未发布 Gemini 功能的高级用户参与。🔗 报名
-
Gemini——70+ 语言的多语言麦克风(Android 和 iOS):麦克风图标现已支持 70 多种语言,并可自由混用而无需更改设置。通过 @joshwoodward(Gemini App 产品总监)宣布。
-
GitHub Code Quality——组织一键启用(6月16日):组织管理员可以在安全设置中通过一个开关,对所有仓库启用或停用 Code Quality。🔗 更新日志
-
Copilot 使用指标——通过服务器遥测增强(6月15日):Copilot Enterprise 使用报告现在整合了服务器端检测到的活跃用户(除了客户端遥测之外),从而提升了每日和 28 天报告中 DAU 的覆盖率。🔗 更新日志
-
Manus——执行期间的消息队列(6月16日):Manus 现在允许在任务进行中,将要发送给代理的消息排入队列。消息会在当前任务结束后按顺序处理。🔗 公告
-
ChatGPT iOS 1.2026.160(6月15日):工作区文件浏览器、文件夹选择器、差异对比控件、通过聊天或全局进行 MCP 批准,以及消息和 Codex 计划中的 LaTeX 渲染。
这意味着什么
GLM-5.2 的 MIT 开源权重,以及三款 Qwen-Robot Suite 机器人模型,体现了中国开源供给在美国厂商仍大多保持专有的赛道上正在加速。GLM-5.2 以其 100 万 token 上下文窗口和 MIT 许可,直接成为那些寻求主权替代方案企业的商业模型竞争者——这正是美国限制 Anthropic 访问的指令让其在战略上变得清晰可见的赛道,而 Cohere 报告的需求涌入也印证了这一点。机器人领域是这场竞争的下一个战场:Qwen-Robot Suite 提供了完整的 navigation-manipulation-world model 技术栈,而 NVIDIA Research 的 SpatialClaw 则表明,无需 fine-tuning 也能实现高级空间推理——这两种互补路径共同勾勒出下一代代理式机器人系统的架构。
在硬件层面,MLPerf Training 6.0 的结果确认了 Blackwell 架构在工业规模上的主导地位:在 8,192 张 GPU 上用 2 分钟训练 DeepSeek-V3(6710 亿参数),这不是学术炫技,而是真实部署在云数据中心中的生产能力。三个月内在不更换硬件的情况下将 DeepSeek-V3 吞吐量提升 1.3× 的软件改进提醒我们,AI 性能竞赛既是软件栈(NeMo、CuTe DSL、MXFP8)的竞争,也是芯片的竞争——而这种动态会进一步强化既有的强势地位。
Anthropic 关于 Claude Code 的经济研究提供了一个重要且反直觉的视角:领域专业知识(法律、管理、科学)对与编码代理合作的成功几乎与代码本身的掌握程度同样重要。经验证的成功率显示,工程师与其领域内的非开发专家之间仅相差 7 个百分点。对于产品团队而言,这是一个结构性信息:AI 编码工具的目标用户不再只是开发者,接口设计也必须考虑这一点。
在开发者工具方面,6 月 16 日集中释放出多个相互呼应的信号:GitHub Code Quality 的付费 GA($10/活跃开发者)、Codex 在 EEA/UK/瑞士提供 Computer Use、Claude Code v2.1.178 的细粒度权限,以及 OpenAI 的 Deployment Simulation 方法。代码质量与部署安全正从研究议题走向收费产品——这反映了开发团队 AI 工具市场日益成熟的趋势。
来源
- Z.ai GLM-5.2 — @Zai_org 在 X 上
- Z.ai GLM-5.2 — 官方博客
- Qwen-Robot Suite — @Alibaba_Qwen 在 X 上
- Qwen-Robot Suite — 官方博客
- NVIDIA Blackwell MLPerf Training 6.0
- 2026 年 6 月 Pixel Drop —— Google 官方博客
- 6 月 Pixel Drop — @GeminiApp 在 X 上
- GitHub Code Quality GA — 更新日志
- Anthropic 经济研究 — Claude Code
- Anthropic — @AnthropicAI 在 X 上
- Claude Managed Agents — 博客
- Claude Code v2.1.178
- Claude Code v2.1.179
- Codex app EEA/UK/瑞士 — @OpenAIDevs 在 X 上
- Deployment Simulation — OpenAI
- Codex CLI 0.140.0 — GitHub 发布
- Meta AI — Facebook 新工具
- Meta AI — @MetaNewsroom 在 X 上
- NVIDIA SpatialClaw — @NVIDIAAI 在 X 上
- Cohere — @cohere 在 X 上
- GitHub Models retirement
- GitHub Code Quality — 组织启用
- Copilot usage metrics — 更新日志
- Manus — 消息队列
- Gemini Trusted Tester Program