ai-powered-markdown-translator由 gpt-5.4-mini 将文章从法语翻译成中文。
一周之中有两则重磅消息:DeepSeek 发布其新旗舰模型 V4 Preview,提供一百万 token 的上下文窗口且定价极低;Anthropic 证明 Opus 4.7 在合成化学中的 NMR 参考软件面前也能一较高下。开发工具方面,Claude Code 持续迭代,GitHub Copilot 也为代理式任务开放了 REST API。
DeepSeek-V4 Preview — V4 Flash 与 V4 Pro 模型,1M token 上下文
6 月 6 日 — DeepSeek 发布其新旗舰模型 DeepSeek-V4 的预览版(preview),并提供两个版本:deepseek-v4-flash 和 deepseek-v4-pro。两者都提供 100 万 tokens 的上下文窗口和 384,000 tokens 的最大输出——这些能力位于 frontier 市场的高端。
官方公告横幅强调了模型在推理和代理能力(Agent capabilities)上的定位:
🎉 DeepSeek-V4 Preview is here with stronger Agent capabilities and top-tier reasoning. Now available on Web, App, and API.
🇨🇳 DeepSeek-V4 Preview 现已上线,具备增强的代理能力和一流的推理能力。现在可在网页、应用和 API 上使用。 — deepseek.com(官方公告横幅)
每个模型都支持 推理模式(thinking,默认开启)和 标准模式(non-thinking)。网页、移动应用和 API 均可立即使用。旧的标识符 deepseek-chat 和 deepseek-reasoner 将于 2026 年 7 月 24 日 弃用;它们现在分别对应 deepseek-v4-flash 的 non-thinking 和 thinking 模式。
**对开发者的一个重要细节:**DeepSeek API 提供一个 兼容 Anthropic 格式 的 endpoint(https://api.deepseek.com/anthropic),同时也支持 OpenAI 格式——这使得可以在 Claude Code 等工具中通过变量 ANTHROPIC_BASE_URL 使用 V4,而无需修改代码。
官方价格(api-docs.deepseek.com)
| 模型 | 上下文 | 最大输出 | 输入 cache miss /1M | 输入 cache hit /1M | 输出 /1M | 并发 |
|---|---|---|---|---|---|---|
| deepseek-v4-flash | 1M | 384K | $0,14 | $0,0028 | $0,28 | 2 500 |
| deepseek-v4-pro | 1M | 384K | $0,435 | $0,003625 | $0,87 | 500 |
这些价格仍然远低于可比的西方 frontier 模型:flash 的输出价格为 $0,28 / 1M tokens,pro 为 $0,87——与性能相当的 GPT-5.x 或 Claude 4.x 相比,便宜了一个数量级。
🔗 官方价格
Claude 化学家 — Opus 4.7 在 NMR 上可与 ChemDraw 和 MestReNova 媲美
6 月 5 日 — Anthropic 发布了一篇关于其化学 AI 计划的详细科研文章。该研究由 Anthropic 的化学家 David Kamber 主导,比较了 Claude 在 NMR(Nuclear Magnetic Resonance,核磁共振)光谱上的表现——这是合成化学中的参考分析工具——与专用软件 ChemDraw 和 MestReNova 的表现。
**评估方案:**从模型训练日期之后的 ChemRxiv 预印本中提取的 20 个化合物,分为 4 类结构(氯吡啶嗪、马来酰亚胺、螺环酮、硅基磺酰胺),每一类 5 个化合物。
直接预测(由结构模拟光谱):
| 工具 | ¹H 误差(MAE) | ¹³C 误差(MAE) |
|---|---|---|
| Opus 4.7 | ±0,079 ppm(最佳) | ±1,37 ppm(与 MestReNova 并列) |
| MestReNova | — | ±1,48 ppm |
| Opus 4.6 | 中等 | 中等 |
| Sonnet 4.6 | 较低 | 较低 |
Opus 4.7 在氢(¹H)方面最准确,在碳(¹³C)方面与 MestReNova 并列。至于峰形(splitting patterns),Claude 模型预测峰间距的误差可控制在 0,5 Hz 以内,大约覆盖 80% 的案例;而 ChemDraw 和 MestReNova 只有 26% 到 35%。
**逆向解析(由光谱推结构):**在仅有光谱和分子式的条件下,Opus 4.7 在每次尝试中都能正确找出 8/8 个简单结构。在 7 个复杂结构中,如果提供起始材料信息,它对其中 4 个能做到 3/3 次尝试成功,另外几个则为 2/3。
作者声明的局限性:样本仅 20 个化合物、仅 4 个结构家族、没有 2D NMR、没有立体化学、只测试了 3 种溶剂。Anthropic 表示,后续将把该计划扩展到从专利中读取结构、逆合成(retrosynthesis)以及反应机理。
Claude Code & Cowork — 一周密集更新
Cowork — 使用限制翻倍至 7 月 5 日
6 月 6 日 — Anthropic 临时将 Claude Cowork 对所有付费订阅用户的使用限制翻倍,有效期至 2026 年 7 月 5 日。该措施适用于 5 小时速率限制(5-hour rate limits)。
| 详情 | 数值 |
|---|---|
| 增幅因子 | ×2 |
| 持续时间 | 2026 年 6 月 6 日 → 7 月 5 日 |
| 受影响的套餐 | 所有付费套餐 |
| 访问方式 | Claude 桌面应用 + claude.com/cowork |
We doubled Claude Cowork usage limits for the next month. This applies to your 5-hr rate limits.
🇨🇳 我们已将 Claude Cowork 的使用限制在下个月翻倍。这适用于你们 5 小时的速率限制。 — @bcherny 在 X 上
Claude Code v2.1.163 — 托管版本、/plugin list、增强 hooks
6 月 4 日 — Claude Code 2.1.163 版本为管理员和插件开发者引入了多项功能:
| 功能 | 详情 |
|---|---|
requiredMinimumVersion / requiredMaximumVersion | 强制允许的版本范围;超出范围则拒绝启动 |
/plugin list | 使用筛选条件列出已安装插件 --enabled 和 --disabled |
Hooks Stop / SubagentStop | 返回 hookSpecificOutput.additionalContext 而不会触发错误 |
Skills — 转义 \$ | 在命令体中数字前包含一个字面量 $ |
| MCP stdio | 在 --resume 时接收与 hooks 和 Bash 相同的 CLAUDE_CODE_SESSION_ID |
Claude Code v2.1.166 — fallbackModel、跨会话安全、推理控制
6 月 5 日至 6 日 — 这是本轮中功能最丰富的版本:
| 功能 | 详情 |
|---|---|
fallbackModel | 最多按顺序尝试 3 个回退模型;交互模式下提供 --fallback-model CLI 选项 |
deny 中的 glob 模式 | "*" 会阻止所有工具;未知名称会生成警告 |
SendMessage | 从其他会话转发的消息不再携带用户权限 |
MAX_THINKING_TOKENS=0 | 通过 Claude API 对默认会推理的模型禁用推理 |
claude update | 在下载前宣布目标版本 |
GitHub Copilot — 企业插件与代理式 REST API
VS Code 中由企业管理的插件进入公开预览
6 月 5 日 — VS Code 1.122 版本将此前仅在 Copilot CLI 中提供的企业管理插件功能扩展到 VS Code 客户端。管理员现在可以通过放在 settings.json 中的 .github-private/.github/copilot/settings.json 文件,为整个组织配置并分发插件。
| 方面 | 详情 |
|---|---|
| 套餐 | Copilot Business、Copilot Enterprise |
| 支持的客户端 | VS Code v1.122+、Copilot CLI |
| 插件类型 | 自定义代理、技能、hooks、MCP 配置 |
| 安装 | 认证后自动安装 |
Agent Tasks REST API — 适用于 Pro、Pro+ 和 Max 的公开预览
6 月 4 日 — Agent Tasks REST API 允许以编程方式启动并跟踪 Copilot 云代理的任务。覆盖的使用场景包括:跨大量仓库批量重构、通过内部开发者门户建立新仓库、自动准备新版本。
| 方面 | 详情 |
|---|---|
| 套餐 | Copilot Pro、Pro+、Max |
| 状态 | 公开预览 |
| 身份验证 | 传统 PAT、精确 PAT、OAuth tokens |
OpenAI Codex 与数学推理
Codex CLI 0.137.0 — Multi-agent v2 与企业限制
6 月 4 日 — Codex CLI 升级到 0.137.0,带来了多项面向多代理工作流和 enterprise 部署的改进:
| 新功能 | 详情 |
|---|---|
| Multi-agent v2 | 每条线程保留其执行引擎(runtime)选择;元数据更干净 |
| 企业积分限制 | 查看每月上限 + 应用云配置 bundle |
| 远程控制 | 通过 app-server v2 进行配对(pairing)和访问管理 |
| Web 和 image 工具 | 在 code 模式下可用于更多流程 |
埃尔德什猜想——一个推理模型在 80 年后找到了反例
6 月 4 日 — OpenAI 宣布,其某个推理模型找到了埃尔德什(Erdős)一个已有 80 年历史的数学猜想的反例(counterexample)。这项公告以 OpenAI 播客第 20 期的形式呈现,三位研究员——Alex Wei、Hongxun Wu 和 @wjmzbmr1——在其中讲述了这一发现,并解释了数学家和模型如何协作产生新知识。该播客在 X 上获得了超过 227,000 次观看。
What happened when one of our models found a counterexample to an 80-year-old Erdős conjecture? Researchers @alexwei_, @HongxunWu, and @wjmzbmr1 shared the story on the OpenAI Podcast with @AndrewMayne and explained how mathematicians and models can work together to make new discoveries.
🇨🇳 当我们的一个模型找到埃尔德什 80 年前的猜想反例时,发生了什么?研究员 @alexwei_、@HongxunWu 和 @wjmzbmr1 在与 @AndrewMayne 一起的 OpenAI 播客中讲述了这个故事,解释了数学家和模型如何协作进行新的发现。 — @OpenAI 在 X 上
研究与 CVPR 2026 — Meta SAM 3D 与 NVIDIA PixelDiT 获奖
CVPR 2026(Computer Vision and Pattern Recognition)大会表彰了两项来自 AI 行业的研究工作。
Meta AI SAM 3D — 最佳论文荣誉提名
6 月 5 日 — Meta AI 的 SAM 3D 团队在 CVPR 2026 上获得了 最佳论文荣誉提名(Best Paper Honorable Mention)。SAM 3D 是 Segment Anything(SAM)模型的三维扩展,能够在 3D 场景中对物体进行分割——这对机器人、增强现实和自动驾驶都是关键能力。
🔗 @AIatMeta 推文 · 🔗 arXiv 论文
NVIDIA PixelDiT — 最佳论文入围
6 月 6 日 — NVIDIA Research 宣布,PixelDiT(Pixel Diffusion Transformers)入围 CVPR 2026 最佳论文。该架构是一项流水线创新:现有所有扩散模型(Stable Diffusion、FLUX 等)都先通过自编码器压缩图像再进行扩散——这会引入累积性的质量损失——而 PixelDiT 直接在 pixel space 中一步完成,取消了这一预处理。这种 single-stage 方法消除了中间退化并简化了流水线。
NotebookLM — Source Attribution 与 Cloudflare AI Gateway 上的 Grok
NotebookLM 上线 Source Attribution
6 月 4 日 — Google 为 NotebookLM 推出非常受欢迎的 Source Attribution 功能。用户现在可以看到生成每个工件所使用的精确公式——即提示词(prompts)与来源的组合。一个 “Iterate” 按钮允许直接调整该公式并自定义生成的工件,使生成过程变得透明且可复现。
| 元素 | 详情 |
|---|---|
| 功能 | Source Attribution |
| 关键按钮 | “Iterate” 用于自定义 |
| 可用性 | NotebookLM(网页) |
Grok 可通过 Cloudflare AI Gateway 使用
6 月 4 日 — xAI 宣布,其 Grok 模型(LLM、音频、图像和视频)可通过 Cloudflare AI Gateway 访问。计费由 Cloudflare 统一处理,无需额外的认证配置,也无需管理单独的 xAI API 密钥——这为已经处于 Cloudflare 生态中的开发者简化了集成。
🔗 @xai 公告
简讯
- Claude Code v2.1.165 — 修复 bug,提升可靠性,没有新功能。🔗 版本发布
- Claude Code v2.1.167 — 修复 bug。🔗 版本发布
- Claude Code v2.1.168 — 最新版本(6 月 7 日),修复 bug 并提升可靠性。🔗 版本发布
- Copilot 中的 GPT-5.2 和 GPT-5.2-Codex 已弃用 — 自 6 月 5 日起,这些模型被 GPT-5.5 和 GPT-5.3-Codex 取代。GPT-5.2 仅在代码审查中仍可使用。🔗 更新日志
- GitHub Actions 的 Fix with Copilot 扩展 — Pro、Pro+ 和 Max 订阅者可以一键修复失败的 GitHub Actions 作业(分析 + 修复 PR)。🔗 更新日志
- GitHub 预算管理 API 进入 GA — 通过 API 完整管理预算生命周期(创建、更新、删除),可按组织、仓库、产品或 SKU 过滤 usage summary。🔗 更新日志
- GitHub 计费使用报告 API 进入 GA — 为 GitHub Enterprise 管理员程序化生成 CSV 报告。🔗 更新日志
- Suno — Voices 指南《Your Voice, Reimagined》 — 使用 Voices 功能的 6 条实用建议(用自己的声音唱歌,仅限付费订阅者)。🔗 Suno 文章
- Codex — 体验优化更新(6 月 5 日) — 按类别搜索设置、重启间状态持久化(草稿、缩放、未读指示器)、整体界面打磨。🔗 @OpenAIDevs 推文
- Codex — 自定义个人资料卡 — 个人资料分享卡会随所选主题自适应,并包含所选的虚拟宠物(pet)。🔗 @OpenAIDevs 推文
- Perplexity 集成 Nemotron 3 Ultra(NVIDIA) — 适用于长时代理的 NVIDIA 开源模型,可供 Pro 和 Max 订阅者使用。🔗 @perplexity_ai 推文
- Cohere 参加 Far-Field ASR Leaderboard 网络研讨会(HuggingFace) — Cohere Transcribe 将于 2026 年 6 月 11 日在 FFASR Leaderboard 网络研讨会上介绍。🔗 @cohere 推文
这意味着什么
低成本开源权重模型的竞争正在加剧。 DeepSeek-V4 Preview 为 1M tokens 的上下文窗口设定了新的价格下限:flash 版本输出每 1M tokens $0.28,pro 版本 $0.87。这些价格对西方厂商形成了直接压力;后者为类似能力收取的费用往往高出数个数量级。DeepSeek API 兼容 Anthropic 是一个强烈信号:DeepSeek 正在打互操作性这张牌,以降低迁移成本。
面向开发者的智能体工具链已达到可运营的成熟度。 一周之内,Claude Code 连续发布四个版本(v2.1.163、.165、.166、.168),GitHub Copilot 为智能体任务开放其 REST API 并将企业插件扩展到 VS Code,而 OpenAI 发布了带有 multi-agent v2 的 Codex CLI 0.137.0。这已经不再是试验:三家厂商都在交付治理能力(受管版本控制、额度限制、会话间安全),表明产品正在向企业级规模部署。
AI 在科学领域的应用开始产出首批可测量结果。 Anthropic 的 NMR 研究带来了一种罕见的东西:在未见数据上,对通用语言模型与化学家专用软件进行严格比较。Opus 4.7 在氢原子上获得了最佳绝对误差,并在峰形上达到 80% 的准确率——而专用工具只有 26-35%。这还不是对 ChemDraw 的替代,但它证明了 frontier 模型无需特定微调,也能与垂直领域工具竞争。
计算机视觉获得了双重学术认可。 CVPR 2026 同时将奖项授予 SAM 3D(Meta)和 PixelDiT(NVIDIA)。这两项认可体现了相互补充的技术方向:SAM 3D 将分割推进到体积层面,PixelDiT 则通过移除自编码器预处理,重新审视扩散流水线的基础。AI 行业不再只围绕语言模型运转——3D 视觉感知与高质量图像生成正在并行推进。
来源
- DeepSeek — 官方公告横幅
- DeepSeek — 官方 API 定价
- Anthropic — Making Claude a chemist
- Cowork ×2 公告 — @claudeai
- Cowork ×2 公告 — @bcherny
- Claude Code v2.1.163
- Claude Code v2.1.165
- Claude Code v2.1.166
- Claude Code v2.1.167
- Claude Code v2.1.168
- GitHub Copilot — 企业托管插件 VS Code
- GitHub Copilot — Agent Tasks REST API
- GitHub Copilot — GPT-5.2 已弃用
- GitHub Copilot — Actions 的 Fix with Copilot
- GitHub — 预算与使用量 API GA
- GitHub — 账单报告 API GA
- OpenAI Codex Changelog
- OpenAI — Erdős 猜想(推文)
- OpenAI — 播客第 20 集(YouTube)
- OpenAI Codex — QoL 更新(推文)
- OpenAI Codex — profile share card
- Meta AI SAM 3D — CVPR 2026
- Meta AI SAM 3D — arXiv 论文
- NVIDIA PixelDiT — CVPR 2026
- NotebookLM — 来源归因
- xAI — Cloudflare AI Gateway 上的 Grok
- Suno — Voices 指南
- Perplexity — Nemotron 3 Ultra
- Cohere — HuggingFace FFASR 网络研讨会