DeepSeek-V4 预览版、Claude 化学家（NMR）、CVPR 2026 奖项

一周之中有两则重磅消息：DeepSeek 发布其新旗舰模型 V4 Preview，提供一百万 token 的上下文窗口且定价极低；Anthropic 证明 Opus 4.7 在合成化学中的 NMR 参考软件面前也能一较高下。开发工具方面，Claude Code 持续迭代，GitHub Copilot 也为代理式任务开放了 REST API。

DeepSeek-V4 Preview — V4 Flash 与 V4 Pro 模型，1M token 上下文

6 月 6 日 — DeepSeek 发布其新旗舰模型 DeepSeek-V4 的预览版（preview），并提供两个版本：deepseek-v4-flash 和 deepseek-v4-pro。两者都提供 100 万 tokens 的上下文窗口和 384,000 tokens 的最大输出——这些能力位于 frontier 市场的高端。

官方公告横幅强调了模型在推理和代理能力（Agent capabilities）上的定位：

🎉 DeepSeek-V4 Preview is here with stronger Agent capabilities and top-tier reasoning. Now available on Web, App, and API.

🇨🇳 DeepSeek-V4 Preview 现已上线，具备增强的代理能力和一流的推理能力。现在可在网页、应用和 API 上使用。 — deepseek.com（官方公告横幅）

每个模型都支持 推理模式（thinking，默认开启）和 标准模式（non-thinking）。网页、移动应用和 API 均可立即使用。旧的标识符 deepseek-chat 和 deepseek-reasoner 将于 2026 年 7 月 24 日 弃用；它们现在分别对应 deepseek-v4-flash 的 non-thinking 和 thinking 模式。

**对开发者的一个重要细节：**DeepSeek API 提供一个 兼容 Anthropic 格式 的 endpoint（https://api.deepseek.com/anthropic），同时也支持 OpenAI 格式——这使得可以在 Claude Code 等工具中通过变量 ANTHROPIC_BASE_URL 使用 V4，而无需修改代码。

🔗 deepseek.com

官方价格（api-docs.deepseek.com）

模型	上下文	最大输出	输入 cache miss /1M	输入 cache hit /1M	输出 /1M	并发
deepseek-v4-flash	1M	384K	$0,14	$0,0028	$0,28	2 500
deepseek-v4-pro	1M	384K	$0,435	$0,003625	$0,87	500

这些价格仍然远低于可比的西方 frontier 模型：flash 的输出价格为 $0,28 / 1M tokens，pro 为 $0,87——与性能相当的 GPT-5.x 或 Claude 4.x 相比，便宜了一个数量级。

🔗 官方价格

Claude 化学家 — Opus 4.7 在 NMR 上可与 ChemDraw 和 MestReNova 媲美

6 月 5 日 — Anthropic 发布了一篇关于其化学 AI 计划的详细科研文章。该研究由 Anthropic 的化学家 David Kamber 主导，比较了 Claude 在 NMR（Nuclear Magnetic Resonance，核磁共振）光谱上的表现——这是合成化学中的参考分析工具——与专用软件 ChemDraw 和 MestReNova 的表现。

**评估方案：**从模型训练日期之后的 ChemRxiv 预印本中提取的 20 个化合物，分为 4 类结构（氯吡啶嗪、马来酰亚胺、螺环酮、硅基磺酰胺），每一类 5 个化合物。

直接预测（由结构模拟光谱）：

工具	¹H 误差（MAE）	¹³C 误差（MAE）
Opus 4.7	±0,079 ppm（最佳）	±1,37 ppm（与 MestReNova 并列）
MestReNova	—	±1,48 ppm
Opus 4.6	中等	中等
Sonnet 4.6	较低	较低

Opus 4.7 在氢（¹H）方面最准确，在碳（¹³C）方面与 MestReNova 并列。至于峰形（splitting patterns），Claude 模型预测峰间距的误差可控制在 0,5 Hz 以内，大约覆盖 80% 的案例；而 ChemDraw 和 MestReNova 只有 26% 到 35%。

**逆向解析（由光谱推结构）：**在仅有光谱和分子式的条件下，Opus 4.7 在每次尝试中都能正确找出 8/8 个简单结构。在 7 个复杂结构中，如果提供起始材料信息，它对其中 4 个能做到 3/3 次尝试成功，另外几个则为 2/3。

作者声明的局限性：样本仅 20 个化合物、仅 4 个结构家族、没有 2D NMR、没有立体化学、只测试了 3 种溶剂。Anthropic 表示，后续将把该计划扩展到从专利中读取结构、逆合成（retrosynthesis）以及反应机理。

🔗 Anthropic 科研文章

Claude Code & Cowork — 一周密集更新

Cowork — 使用限制翻倍至 7 月 5 日

6 月 6 日 — Anthropic 临时将 Claude Cowork 对所有付费订阅用户的使用限制翻倍，有效期至 2026 年 7 月 5 日。该措施适用于 5 小时速率限制（5-hour rate limits）。

详情	数值
增幅因子	×2
持续时间	2026 年 6 月 6 日 → 7 月 5 日
受影响的套餐	所有付费套餐
访问方式	Claude 桌面应用 + claude.com/cowork

We doubled Claude Cowork usage limits for the next month. This applies to your 5-hr rate limits.

🇨🇳 我们已将 Claude Cowork 的使用限制在下个月翻倍。这适用于你们 5 小时的速率限制。 — @bcherny 在 X 上

🔗 @claudeai 公告

Claude Code v2.1.163 — 托管版本、/plugin list、增强 hooks

6 月 4 日 — Claude Code 2.1.163 版本为管理员和插件开发者引入了多项功能：

功能	详情
`requiredMinimumVersion` / `requiredMaximumVersion`	强制允许的版本范围；超出范围则拒绝启动
`/plugin list`	使用筛选条件列出已安装插件 `--enabled` 和 `--disabled`
Hooks `Stop` / `SubagentStop`	返回 `hookSpecificOutput.additionalContext` 而不会触发错误
Skills — 转义 `\$`	在命令体中数字前包含一个字面量 `$`
MCP stdio	在 `--resume` 时接收与 hooks 和 Bash 相同的 `CLAUDE_CODE_SESSION_ID`

🔗 v2.1.163 版本发布

Claude Code v2.1.166 — fallbackModel、跨会话安全、推理控制

6 月 5 日至 6 日 — 这是本轮中功能最丰富的版本：

功能	详情
`fallbackModel`	最多按顺序尝试 3 个回退模型；交互模式下提供 `--fallback-model` CLI 选项
`deny` 中的 glob 模式	`"*"` 会阻止所有工具；未知名称会生成警告
`SendMessage`	从其他会话转发的消息不再携带用户权限
`MAX_THINKING_TOKENS=0`	通过 Claude API 对默认会推理的模型禁用推理
`claude update`	在下载前宣布目标版本

🔗 v2.1.166 版本发布

GitHub Copilot — 企业插件与代理式 REST API

VS Code 中由企业管理的插件进入公开预览

6 月 5 日 — VS Code 1.122 版本将此前仅在 Copilot CLI 中提供的企业管理插件功能扩展到 VS Code 客户端。管理员现在可以通过放在 settings.json 中的 .github-private/.github/copilot/settings.json 文件，为整个组织配置并分发插件。

方面	详情
套餐	Copilot Business、Copilot Enterprise
支持的客户端	VS Code v1.122+、Copilot CLI
插件类型	自定义代理、技能、hooks、MCP 配置
安装	认证后自动安装

🔗 GitHub 更新日志

Agent Tasks REST API — 适用于 Pro、Pro+ 和 Max 的公开预览

6 月 4 日 — Agent Tasks REST API 允许以编程方式启动并跟踪 Copilot 云代理的任务。覆盖的使用场景包括：跨大量仓库批量重构、通过内部开发者门户建立新仓库、自动准备新版本。

方面	详情
套餐	Copilot Pro、Pro+、Max
状态	公开预览
身份验证	传统 PAT、精确 PAT、OAuth tokens

🔗 GitHub 更新日志

OpenAI Codex 与数学推理

Codex CLI 0.137.0 — Multi-agent v2 与企业限制

6 月 4 日 — Codex CLI 升级到 0.137.0，带来了多项面向多代理工作流和 enterprise 部署的改进：

新功能	详情
Multi-agent v2	每条线程保留其执行引擎（runtime）选择；元数据更干净
企业积分限制	查看每月上限 + 应用云配置 bundle
远程控制	通过 app-server v2 进行配对（pairing）和访问管理
Web 和 image 工具	在 code 模式下可用于更多流程

🔗 Codex 更新日志

埃尔德什猜想——一个推理模型在 80 年后找到了反例

6 月 4 日 — OpenAI 宣布，其某个推理模型找到了埃尔德什（Erdős）一个已有 80 年历史的数学猜想的反例（counterexample）。这项公告以 OpenAI 播客第 20 期的形式呈现，三位研究员——Alex Wei、Hongxun Wu 和 @wjmzbmr1——在其中讲述了这一发现，并解释了数学家和模型如何协作产生新知识。该播客在 X 上获得了超过 227,000 次观看。

What happened when one of our models found a counterexample to an 80-year-old Erdős conjecture? Researchers @alexwei_, @HongxunWu, and @wjmzbmr1 shared the story on the OpenAI Podcast with @AndrewMayne and explained how mathematicians and models can work together to make new discoveries.

🇨🇳 当我们的一个模型找到埃尔德什 80 年前的猜想反例时，发生了什么？研究员 @alexwei_、@HongxunWu 和 @wjmzbmr1 在与 @AndrewMayne 一起的 OpenAI 播客中讲述了这个故事，解释了数学家和模型如何协作进行新的发现。 — @OpenAI 在 X 上

研究与 CVPR 2026 — Meta SAM 3D 与 NVIDIA PixelDiT 获奖

CVPR 2026（Computer Vision and Pattern Recognition）大会表彰了两项来自 AI 行业的研究工作。

Meta AI SAM 3D — 最佳论文荣誉提名

6 月 5 日 — Meta AI 的 SAM 3D 团队在 CVPR 2026 上获得了 最佳论文荣誉提名（Best Paper Honorable Mention）。SAM 3D 是 Segment Anything（SAM）模型的三维扩展，能够在 3D 场景中对物体进行分割——这对机器人、增强现实和自动驾驶都是关键能力。

🔗 @AIatMeta 推文 · 🔗 arXiv 论文

NVIDIA PixelDiT — 最佳论文入围

6 月 6 日 — NVIDIA Research 宣布，PixelDiT（Pixel Diffusion Transformers）入围 CVPR 2026 最佳论文。该架构是一项流水线创新：现有所有扩散模型（Stable Diffusion、FLUX 等）都先通过自编码器压缩图像再进行扩散——这会引入累积性的质量损失——而 PixelDiT 直接在 pixel space 中一步完成，取消了这一预处理。这种 single-stage 方法消除了中间退化并简化了流水线。

🔗 @NVIDIAAI 推文

NotebookLM — Source Attribution 与 Cloudflare AI Gateway 上的 Grok

NotebookLM 上线 Source Attribution

6 月 4 日 — Google 为 NotebookLM 推出非常受欢迎的 Source Attribution 功能。用户现在可以看到生成每个工件所使用的精确公式——即提示词（prompts）与来源的组合。一个 “Iterate” 按钮允许直接调整该公式并自定义生成的工件，使生成过程变得透明且可复现。

元素	详情
功能	Source Attribution
关键按钮	“Iterate” 用于自定义
可用性	NotebookLM（网页）

🔗 @NotebookLM 公告

Grok 可通过 Cloudflare AI Gateway 使用

6 月 4 日 — xAI 宣布，其 Grok 模型（LLM、音频、图像和视频）可通过 Cloudflare AI Gateway 访问。计费由 Cloudflare 统一处理，无需额外的认证配置，也无需管理单独的 xAI API 密钥——这为已经处于 Cloudflare 生态中的开发者简化了集成。

🔗 @xai 公告

简讯

Claude Code v2.1.165 — 修复 bug，提升可靠性，没有新功能。🔗 版本发布
Claude Code v2.1.167 — 修复 bug。🔗 版本发布
Claude Code v2.1.168 — 最新版本（6 月 7 日），修复 bug 并提升可靠性。🔗 版本发布
Copilot 中的 GPT-5.2 和 GPT-5.2-Codex 已弃用 — 自 6 月 5 日起，这些模型被 GPT-5.5 和 GPT-5.3-Codex 取代。GPT-5.2 仅在代码审查中仍可使用。🔗 更新日志
GitHub Actions 的 Fix with Copilot 扩展 — Pro、Pro+ 和 Max 订阅者可以一键修复失败的 GitHub Actions 作业（分析 + 修复 PR）。🔗 更新日志
GitHub 预算管理 API 进入 GA — 通过 API 完整管理预算生命周期（创建、更新、删除），可按组织、仓库、产品或 SKU 过滤 usage summary。🔗 更新日志
GitHub 计费使用报告 API 进入 GA — 为 GitHub Enterprise 管理员程序化生成 CSV 报告。🔗 更新日志
Suno — Voices 指南《Your Voice, Reimagined》 — 使用 Voices 功能的 6 条实用建议（用自己的声音唱歌，仅限付费订阅者）。🔗 Suno 文章
Codex — 体验优化更新（6 月 5 日） — 按类别搜索设置、重启间状态持久化（草稿、缩放、未读指示器）、整体界面打磨。🔗 @OpenAIDevs 推文
Codex — 自定义个人资料卡 — 个人资料分享卡会随所选主题自适应，并包含所选的虚拟宠物（pet）。🔗 @OpenAIDevs 推文
Perplexity 集成 Nemotron 3 Ultra（NVIDIA） — 适用于长时代理的 NVIDIA 开源模型，可供 Pro 和 Max 订阅者使用。🔗 @perplexity_ai 推文
Cohere 参加 Far-Field ASR Leaderboard 网络研讨会（HuggingFace） — Cohere Transcribe 将于 2026 年 6 月 11 日在 FFASR Leaderboard 网络研讨会上介绍。🔗 @cohere 推文

这意味着什么

低成本开源权重模型的竞争正在加剧。 DeepSeek-V4 Preview 为 1M tokens 的上下文窗口设定了新的价格下限：flash 版本输出每 1M tokens $0.28，pro 版本 $0.87。这些价格对西方厂商形成了直接压力；后者为类似能力收取的费用往往高出数个数量级。DeepSeek API 兼容 Anthropic 是一个强烈信号：DeepSeek 正在打互操作性这张牌，以降低迁移成本。

面向开发者的智能体工具链已达到可运营的成熟度。 一周之内，Claude Code 连续发布四个版本（v2.1.163、.165、.166、.168），GitHub Copilot 为智能体任务开放其 REST API 并将企业插件扩展到 VS Code，而 OpenAI 发布了带有 multi-agent v2 的 Codex CLI 0.137.0。这已经不再是试验：三家厂商都在交付治理能力（受管版本控制、额度限制、会话间安全），表明产品正在向企业级规模部署。

AI 在科学领域的应用开始产出首批可测量结果。 Anthropic 的 NMR 研究带来了一种罕见的东西：在未见数据上，对通用语言模型与化学家专用软件进行严格比较。Opus 4.7 在氢原子上获得了最佳绝对误差，并在峰形上达到 80% 的准确率——而专用工具只有 26-35%。这还不是对 ChemDraw 的替代，但它证明了 frontier 模型无需特定微调，也能与垂直领域工具竞争。

计算机视觉获得了双重学术认可。 CVPR 2026 同时将奖项授予 SAM 3D（Meta）和 PixelDiT（NVIDIA）。这两项认可体现了相互补充的技术方向：SAM 3D 将分割推进到体积层面，PixelDiT 则通过移除自编码器预处理，重新审视扩散流水线的基础。AI 行业不再只围绕语言模型运转——3D 视觉感知与高质量图像生成正在并行推进。