搜索

DeepSeek-V4 预览版、Claude 化学家(NMR)、CVPR 2026 奖项

DeepSeek-V4 预览版、Claude 化学家(NMR)、CVPR 2026 奖项

ai-powered-markdown-translator

由 gpt-5.4-mini 将文章从法语翻译成中文。

在 GitHub 上查看项目 ↗

一周之中有两则重磅消息:DeepSeek 发布其新旗舰模型 V4 Preview,提供一百万 token 的上下文窗口且定价极低;Anthropic 证明 Opus 4.7 在合成化学中的 NMR 参考软件面前也能一较高下。开发工具方面,Claude Code 持续迭代,GitHub Copilot 也为代理式任务开放了 REST API。


DeepSeek-V4 Preview — V4 Flash 与 V4 Pro 模型,1M token 上下文

6 月 6 日 — DeepSeek 发布其新旗舰模型 DeepSeek-V4 的预览版(preview),并提供两个版本:deepseek-v4-flashdeepseek-v4-pro。两者都提供 100 万 tokens 的上下文窗口和 384,000 tokens 的最大输出——这些能力位于 frontier 市场的高端。

官方公告横幅强调了模型在推理和代理能力(Agent capabilities)上的定位:

🎉 DeepSeek-V4 Preview is here with stronger Agent capabilities and top-tier reasoning. Now available on Web, App, and API.

🇨🇳 DeepSeek-V4 Preview 现已上线,具备增强的代理能力和一流的推理能力。现在可在网页、应用和 API 上使用。 — deepseek.com(官方公告横幅)

每个模型都支持 推理模式thinking,默认开启)和 标准模式non-thinking)。网页、移动应用和 API 均可立即使用。旧的标识符 deepseek-chatdeepseek-reasoner 将于 2026 年 7 月 24 日 弃用;它们现在分别对应 deepseek-v4-flash 的 non-thinking 和 thinking 模式。

**对开发者的一个重要细节:**DeepSeek API 提供一个 兼容 Anthropic 格式 的 endpoint(https://api.deepseek.com/anthropic),同时也支持 OpenAI 格式——这使得可以在 Claude Code 等工具中通过变量 ANTHROPIC_BASE_URL 使用 V4,而无需修改代码。

🔗 deepseek.com

官方价格(api-docs.deepseek.com)

模型上下文最大输出输入 cache miss /1M输入 cache hit /1M输出 /1M并发
deepseek-v4-flash1M384K$0,14$0,0028$0,282 500
deepseek-v4-pro1M384K$0,435$0,003625$0,87500

这些价格仍然远低于可比的西方 frontier 模型:flash 的输出价格为 $0,28 / 1M tokens,pro 为 $0,87——与性能相当的 GPT-5.x 或 Claude 4.x 相比,便宜了一个数量级。

🔗 官方价格


Claude 化学家 — Opus 4.7 在 NMR 上可与 ChemDraw 和 MestReNova 媲美

6 月 5 日 — Anthropic 发布了一篇关于其化学 AI 计划的详细科研文章。该研究由 Anthropic 的化学家 David Kamber 主导,比较了 Claude 在 NMR(Nuclear Magnetic Resonance,核磁共振)光谱上的表现——这是合成化学中的参考分析工具——与专用软件 ChemDraw 和 MestReNova 的表现。

**评估方案:**从模型训练日期之后的 ChemRxiv 预印本中提取的 20 个化合物,分为 4 类结构(氯吡啶嗪、马来酰亚胺、螺环酮、硅基磺酰胺),每一类 5 个化合物。

直接预测(由结构模拟光谱):

工具¹H 误差(MAE)¹³C 误差(MAE)
Opus 4.7±0,079 ppm(最佳)±1,37 ppm(与 MestReNova 并列)
MestReNova±1,48 ppm
Opus 4.6中等中等
Sonnet 4.6较低较低

Opus 4.7 在氢(¹H)方面最准确,在碳(¹³C)方面与 MestReNova 并列。至于峰形(splitting patterns),Claude 模型预测峰间距的误差可控制在 0,5 Hz 以内,大约覆盖 80% 的案例;而 ChemDraw 和 MestReNova 只有 26% 到 35%。

**逆向解析(由光谱推结构):**在仅有光谱和分子式的条件下,Opus 4.7 在每次尝试中都能正确找出 8/8 个简单结构。在 7 个复杂结构中,如果提供起始材料信息,它对其中 4 个能做到 3/3 次尝试成功,另外几个则为 2/3。

作者声明的局限性:样本仅 20 个化合物、仅 4 个结构家族、没有 2D NMR、没有立体化学、只测试了 3 种溶剂。Anthropic 表示,后续将把该计划扩展到从专利中读取结构、逆合成(retrosynthesis)以及反应机理。

🔗 Anthropic 科研文章


Claude Code & Cowork — 一周密集更新

Cowork — 使用限制翻倍至 7 月 5 日

6 月 6 日 — Anthropic 临时将 Claude Cowork 对所有付费订阅用户的使用限制翻倍,有效期至 2026 年 7 月 5 日。该措施适用于 5 小时速率限制(5-hour rate limits)。

详情数值
增幅因子×2
持续时间2026 年 6 月 6 日 → 7 月 5 日
受影响的套餐所有付费套餐
访问方式Claude 桌面应用 + claude.com/cowork

We doubled Claude Cowork usage limits for the next month. This applies to your 5-hr rate limits.

🇨🇳 我们已将 Claude Cowork 的使用限制在下个月翻倍。这适用于你们 5 小时的速率限制。@bcherny 在 X 上

🔗 @claudeai 公告

Claude Code v2.1.163 — 托管版本、/plugin list、增强 hooks

6 月 4 日 — Claude Code 2.1.163 版本为管理员和插件开发者引入了多项功能:

功能详情
requiredMinimumVersion / requiredMaximumVersion强制允许的版本范围;超出范围则拒绝启动
/plugin list使用筛选条件列出已安装插件 --enabled--disabled
Hooks Stop / SubagentStop返回 hookSpecificOutput.additionalContext 而不会触发错误
Skills — 转义 \$在命令体中数字前包含一个字面量 $
MCP stdio--resume 时接收与 hooks 和 Bash 相同的 CLAUDE_CODE_SESSION_ID

🔗 v2.1.163 版本发布

Claude Code v2.1.166 — fallbackModel、跨会话安全、推理控制

6 月 5 日至 6 日 — 这是本轮中功能最丰富的版本:

功能详情
fallbackModel最多按顺序尝试 3 个回退模型;交互模式下提供 --fallback-model CLI 选项
deny 中的 glob 模式"*" 会阻止所有工具;未知名称会生成警告
SendMessage从其他会话转发的消息不再携带用户权限
MAX_THINKING_TOKENS=0通过 Claude API 对默认会推理的模型禁用推理
claude update在下载前宣布目标版本

🔗 v2.1.166 版本发布


GitHub Copilot — 企业插件与代理式 REST API

VS Code 中由企业管理的插件进入公开预览

6 月 5 日 — VS Code 1.122 版本将此前仅在 Copilot CLI 中提供的企业管理插件功能扩展到 VS Code 客户端。管理员现在可以通过放在 settings.json 中的 .github-private/.github/copilot/settings.json 文件,为整个组织配置并分发插件。

方面详情
套餐Copilot Business、Copilot Enterprise
支持的客户端VS Code v1.122+、Copilot CLI
插件类型自定义代理、技能、hooks、MCP 配置
安装认证后自动安装

🔗 GitHub 更新日志

Agent Tasks REST API — 适用于 Pro、Pro+ 和 Max 的公开预览

6 月 4 日 — Agent Tasks REST API 允许以编程方式启动并跟踪 Copilot 云代理的任务。覆盖的使用场景包括:跨大量仓库批量重构、通过内部开发者门户建立新仓库、自动准备新版本。

方面详情
套餐Copilot Pro、Pro+、Max
状态公开预览
身份验证传统 PAT、精确 PAT、OAuth tokens

🔗 GitHub 更新日志


OpenAI Codex 与数学推理

Codex CLI 0.137.0 — Multi-agent v2 与企业限制

6 月 4 日 — Codex CLI 升级到 0.137.0,带来了多项面向多代理工作流和 enterprise 部署的改进:

新功能详情
Multi-agent v2每条线程保留其执行引擎(runtime)选择;元数据更干净
企业积分限制查看每月上限 + 应用云配置 bundle
远程控制通过 app-server v2 进行配对(pairing)和访问管理
Web 和 image 工具在 code 模式下可用于更多流程

🔗 Codex 更新日志

埃尔德什猜想——一个推理模型在 80 年后找到了反例

6 月 4 日 — OpenAI 宣布,其某个推理模型找到了埃尔德什(Erdős)一个已有 80 年历史的数学猜想的反例(counterexample)。这项公告以 OpenAI 播客第 20 期的形式呈现,三位研究员——Alex Wei、Hongxun Wu 和 @wjmzbmr1——在其中讲述了这一发现,并解释了数学家和模型如何协作产生新知识。该播客在 X 上获得了超过 227,000 次观看。

What happened when one of our models found a counterexample to an 80-year-old Erdős conjecture? Researchers @alexwei_, @HongxunWu, and @wjmzbmr1 shared the story on the OpenAI Podcast with @AndrewMayne and explained how mathematicians and models can work together to make new discoveries.

🇨🇳 当我们的一个模型找到埃尔德什 80 年前的猜想反例时,发生了什么?研究员 @alexwei_、@HongxunWu 和 @wjmzbmr1 在与 @AndrewMayne 一起的 OpenAI 播客中讲述了这个故事,解释了数学家和模型如何协作进行新的发现。@OpenAI 在 X 上


研究与 CVPR 2026 — Meta SAM 3D 与 NVIDIA PixelDiT 获奖

CVPR 2026(Computer Vision and Pattern Recognition)大会表彰了两项来自 AI 行业的研究工作。

Meta AI SAM 3D — 最佳论文荣誉提名

6 月 5 日 — Meta AI 的 SAM 3D 团队在 CVPR 2026 上获得了 最佳论文荣誉提名Best Paper Honorable Mention)。SAM 3D 是 Segment Anything(SAM)模型的三维扩展,能够在 3D 场景中对物体进行分割——这对机器人、增强现实和自动驾驶都是关键能力。

🔗 @AIatMeta 推文 · 🔗 arXiv 论文

NVIDIA PixelDiT — 最佳论文入围

6 月 6 日 — NVIDIA Research 宣布,PixelDiTPixel Diffusion Transformers)入围 CVPR 2026 最佳论文。该架构是一项流水线创新:现有所有扩散模型(Stable Diffusion、FLUX 等)都先通过自编码器压缩图像再进行扩散——这会引入累积性的质量损失——而 PixelDiT 直接在 pixel space 中一步完成,取消了这一预处理。这种 single-stage 方法消除了中间退化并简化了流水线。

🔗 @NVIDIAAI 推文


NotebookLM — Source Attribution 与 Cloudflare AI Gateway 上的 Grok

NotebookLM 上线 Source Attribution

6 月 4 日 — Google 为 NotebookLM 推出非常受欢迎的 Source Attribution 功能。用户现在可以看到生成每个工件所使用的精确公式——即提示词(prompts)与来源的组合。一个 “Iterate” 按钮允许直接调整该公式并自定义生成的工件,使生成过程变得透明且可复现。

元素详情
功能Source Attribution
关键按钮“Iterate” 用于自定义
可用性NotebookLM(网页)

🔗 @NotebookLM 公告

Grok 可通过 Cloudflare AI Gateway 使用

6 月 4 日 — xAI 宣布,其 Grok 模型(LLM、音频、图像和视频)可通过 Cloudflare AI Gateway 访问。计费由 Cloudflare 统一处理,无需额外的认证配置,也无需管理单独的 xAI API 密钥——这为已经处于 Cloudflare 生态中的开发者简化了集成。

🔗 @xai 公告


简讯

  • Claude Code v2.1.165 — 修复 bug,提升可靠性,没有新功能。🔗 版本发布
  • Claude Code v2.1.167 — 修复 bug。🔗 版本发布
  • Claude Code v2.1.168 — 最新版本(6 月 7 日),修复 bug 并提升可靠性。🔗 版本发布
  • Copilot 中的 GPT-5.2 和 GPT-5.2-Codex 已弃用 — 自 6 月 5 日起,这些模型被 GPT-5.5 和 GPT-5.3-Codex 取代。GPT-5.2 仅在代码审查中仍可使用。🔗 更新日志
  • GitHub Actions 的 Fix with Copilot 扩展 — Pro、Pro+ 和 Max 订阅者可以一键修复失败的 GitHub Actions 作业(分析 + 修复 PR)。🔗 更新日志
  • GitHub 预算管理 API 进入 GA — 通过 API 完整管理预算生命周期(创建、更新、删除),可按组织、仓库、产品或 SKU 过滤 usage summary。🔗 更新日志
  • GitHub 计费使用报告 API 进入 GA — 为 GitHub Enterprise 管理员程序化生成 CSV 报告。🔗 更新日志
  • Suno — Voices 指南《Your Voice, Reimagined》 — 使用 Voices 功能的 6 条实用建议(用自己的声音唱歌,仅限付费订阅者)。🔗 Suno 文章
  • Codex — 体验优化更新(6 月 5 日) — 按类别搜索设置、重启间状态持久化(草稿、缩放、未读指示器)、整体界面打磨。🔗 @OpenAIDevs 推文
  • Codex — 自定义个人资料卡 — 个人资料分享卡会随所选主题自适应,并包含所选的虚拟宠物(pet)。🔗 @OpenAIDevs 推文
  • Perplexity 集成 Nemotron 3 Ultra(NVIDIA) — 适用于长时代理的 NVIDIA 开源模型,可供 Pro 和 Max 订阅者使用。🔗 @perplexity_ai 推文
  • Cohere 参加 Far-Field ASR Leaderboard 网络研讨会(HuggingFace) — Cohere Transcribe 将于 2026 年 6 月 11 日在 FFASR Leaderboard 网络研讨会上介绍。🔗 @cohere 推文

这意味着什么

低成本开源权重模型的竞争正在加剧。 DeepSeek-V4 Preview 为 1M tokens 的上下文窗口设定了新的价格下限:flash 版本输出每 1M tokens $0.28,pro 版本 $0.87。这些价格对西方厂商形成了直接压力;后者为类似能力收取的费用往往高出数个数量级。DeepSeek API 兼容 Anthropic 是一个强烈信号:DeepSeek 正在打互操作性这张牌,以降低迁移成本。

面向开发者的智能体工具链已达到可运营的成熟度。 一周之内,Claude Code 连续发布四个版本(v2.1.163、.165、.166、.168),GitHub Copilot 为智能体任务开放其 REST API 并将企业插件扩展到 VS Code,而 OpenAI 发布了带有 multi-agent v2 的 Codex CLI 0.137.0。这已经不再是试验:三家厂商都在交付治理能力(受管版本控制、额度限制、会话间安全),表明产品正在向企业级规模部署。

AI 在科学领域的应用开始产出首批可测量结果。 Anthropic 的 NMR 研究带来了一种罕见的东西:在未见数据上,对通用语言模型与化学家专用软件进行严格比较。Opus 4.7 在氢原子上获得了最佳绝对误差,并在峰形上达到 80% 的准确率——而专用工具只有 26-35%。这还不是对 ChemDraw 的替代,但它证明了 frontier 模型无需特定微调,也能与垂直领域工具竞争。

计算机视觉获得了双重学术认可。 CVPR 2026 同时将奖项授予 SAM 3D(Meta)和 PixelDiT(NVIDIA)。这两项认可体现了相互补充的技术方向:SAM 3D 将分割推进到体积层面,PixelDiT 则通过移除自编码器预处理,重新审视扩散流水线的基础。AI 行业不再只围绕语言模型运转——3D 视觉感知与高质量图像生成正在并行推进。


来源