検索

DeepSeek-V4 Preview、Claude化学者(NMR)、CVPR 2026の受賞

DeepSeek-V4 Preview、Claude化学者(NMR)、CVPR 2026の受賞

ai-powered-markdown-translator

gpt-5.4-miniを使用してfrからjaへ翻訳された記事。

GitHub でプロジェクトを見る ↗

今週は2つの大きな発表が話題をさらった。DeepSeekは、100万トークンのコンテキスト窓を非常に低価格で備えた新たな旗艦モデルV4 Previewを公開し、AnthropicはOpus 4.7が合成化学のNMR参照ソフトウェアに匹敵することを実証した。開発者向けツールでは、Claude Codeが次々とバージョンアップし、GitHub Copilotがエージェント向けタスクのためのREST APIを公開した。


DeepSeek-V4 Preview — V4 FlashとV4 Pro、1Mトークンのコンテキスト

6月6日 — DeepSeekは、新たな旗艦モデルDeepSeek-V4のプレリリース(preview)版を、deepseek-v4-flashdeepseek-v4-pro の2種類で公開した。両者とも、100万トークンのコンテキスト窓と384,000トークンの最大出力を備えており、フロンティア市場の上位に位置する性能だ。

公式発表バナーでは、モデルの推論とエージェント能力(Agent capabilities)における位置づけが強調されている。

🎉 DeepSeek-V4 Preview is here with stronger Agent capabilities and top-tier reasoning. Now available on Web, App, and API.

🇯🇵 DeepSeek-V4 Preview は、強化されたエージェント能力と最先端の推論機能を備えて利用可能です。Web、アプリ、APIで今すぐご利用いただけます。 — deepseek.com(公式発表バナー)

各モデルは、thinkingモード(デフォルトで有効)と標準モードnon-thinking)をサポートする。Web、モバイルアプリ、APIで即時利用可能だ。旧IDのdeepseek-chatdeepseek-reasoner2026年7月24日に廃止予定で、現在はそれぞれ deepseek-v4-flash のnon-thinkingモードとthinkingモードに対応している。

開発者向けの注目点: DeepSeek APIは、OpenAI形式に加えてAnthropic互換形式のエンドポイント(https://api.deepseek.com/anthropic)を公開している。これにより、コード変更なしで ANTHROPIC_BASE_URL のようなツールからV4を利用できる。

🔗 deepseek.com

公式料金(api-docs.deepseek.com)

モデルコンテキスト最大出力Input cache miss /1MInput cache hit /1MOutput /1M同時実行数
deepseek-v4-flash1M384K$0,14$0,0028$0,282 500
deepseek-v4-pro1M384K$0,435$0,003625$0,87500

これらの料金は、同等性能の西側フロンティアモデルを大きく下回る。出力1Mトークンあたりflashは$0,28、proは$0,87で、GPT-5.xやClaude 4.xの同等能力の提供に比べて桁違いに安い。

🔗 公式料金


Claude化学者 — Opus 4.7がNMRでChemDrawとMestReNovaに匹敵

6月5日 — Anthropicは、自社の化学向けAIプログラムに関する詳細な学術論文を公開した。この研究はAnthropicの化学者David Kamberが主導し、合成化学における参照解析ツールであるNMR(Nuclear Magnetic Resonance)分光法でのClaudeの性能を、専用ソフトウェアのChemDrawおよびMestReNovaと比較している。

評価プロトコル: モデルの学習日より後に公開されたChemRxivのプレプリントから抽出した20化合物を、4つの構造ファミリー(クロロピリダジン、マレイミド、スピロケトン、シリル化スルホンアミド)に分け、各ファミリー5化合物ずつで評価。

直接予測(構造からシミュレートしたスペクトル):

ツール¹H誤差(MAE)¹³C誤差(MAE)
Opus 4.7±0,079 ppm(最良)±1,37 ppm(MestReNovaと同率)
MestReNova±1,48 ppm
Opus 4.6中間中間
Sonnet 4.6低い低い

Opus 4.7は水素(¹H)で最も正確であり、炭素(¹³C)ではMestReNovaと同率だった。ピークの形(splitting patterns)についても、Claudeモデルは約80%のケースで0.5 Hzの許容範囲内に分離間隔を予測し、ChemDrawとMestReNovaの26〜35%を上回った。

逆推定(スペクトルから構造を復元): Opus 4.7は、スペクトルと分子式だけから、簡単な構造8/8件を各試行で正しく復元した。7つの複雑な構造では、出発物質の情報が与えられた場合、4つについては3/3回、残りについては2/3回成功した。

著者らが示した制約は、化合物数が20件 בלבד、構造ファミリーが4種類、2D NMRの欠如、立体化学なし、試験溶媒が3種類のみ、という点だ。Anthropicはこのプログラムを、特許からの構造読解、逆合成(retrosynthesis)、反応機構へと拡張すると発表している。

🔗 Anthropicの学術論文


Claude Code & Cowork — 更新が目白押しの1週間

Cowork — 7月5日まで利用上限を倍増

6月6日 — Anthropicは、Claude Coworkの利用上限を有料購読者全員向けに一時的に倍増し、2026年7月5日まで有効とした。この措置は、5時間ごとのレート制限(5-hour rate limits)に適用される。

詳細
増加倍率×2
期間2026年6月6日 → 7月5日
対象プランすべての有料プラン
アクセスClaudeデスクトップアプリ + claude.com/cowork

We doubled Claude Cowork usage limits for the next month. This applies to your 5-hr rate limits.

🇯🇵 Claude Coworkの利用上限を来月いっぱい倍増しました。これは5時間ごとのレート制限に適用されます。@bcherny のX

🔗 @claudeaiの発表

Claude Code v2.1.163 — 管理されたバージョン、/plugin list、強化されたhooks

6月4日 — Claude Codeの2.1.163版では、管理者とプラグイン開発者向けにいくつかの機能が追加された。

機能詳細
requiredMinimumVersion / requiredMaximumVersion許可されるバージョン範囲を強制し、範囲外の起動を拒否
/plugin listインストール済みプラグインを --enabled--disabled で一覧表示
Hooks Stop / SubagentStopエラーを発生させずに hookSpecificOutput.additionalContext を返す
Skills — エスケープ \$コマンド本文で数字の前にリテラルな $ を含める
MCP stdio--resume 時にhooksやBashと同じ CLAUDE_CODE_SESSION_ID を受け取る

🔗 リリース v2.1.163

Claude Code v2.1.166 — fallbackModel、セッション間セキュリティ、推論制御

6月5〜6日 — 機能面で最も充実した版:

機能詳細
fallbackModel最大3つのフォールバックモデルを順番に試行。対話時のCLIオプションは --fallback-model
deny のグロブパターン"*" がすべてのツールをブロック。未知の名前には警告を生成
SendMessage他セッションから中継されたメッセージは、ユーザー権限をもはや持ち越さない
MAX_THINKING_TOKENS=0Claude APIでデフォルトで推論するモデルの推論を無効化
claude updateダウンロード前に対象バージョンを通知

🔗 リリース v2.1.166


GitHub Copilot — エンタープライズプラグインとエージェント型REST API

VS Codeでのエンタープライズ管理プラグインがパブリックプレビューに

6月5日 — VS Code 1.122は、これまでCopilot CLIでのみ利用可能だったエンタープライズ管理プラグイン機能をVS Codeクライアントにも拡張した。管理者は、settings.json ファイルを .github-private/.github/copilot/settings.json に配置することで、組織全体にプラグインを設定・配布できるようになった。

項目詳細
プランCopilot Business, Copilot Enterprise
対応クライアントVS Code v1.122+, Copilot CLI
プラグインの種類カスタムエージェント、スキル、hooks、MCP設定
インストール認証時に自動

🔗 GitHubの変更履歴

Agent Tasks REST API — Pro、Pro+、Max向けパブリックプレビュー

6月4日 — Agent Tasks REST APIにより、Copilotクラウドエージェントのタスクをプログラムから起動・追跡できるようになった。想定されるユースケースは、大量のリポジトリにまたがる一括リファクタリング、社内開発ポータルからの新規リポジトリの立ち上げ、新しいリリースの自動準備など。

項目詳細
プランCopilot Pro, Pro+, Max
ステータスパブリックプレビュー
認証従来のPAT、細粒度PAT、OAuthトークン

🔗 GitHubの変更履歴


OpenAI Codex と数学的推論

Codex CLI 0.137.0 — Multi-agent v2 と enterprise制限

6月4日 — Codex CLIが0.137.0に更新され、マルチエージェントワークフローとenterprise展開向けに複数の改善が加わった。

新機能詳細
Multi-agent v2各スレッドが実行エンジン(runtime)の選択を保持し、メタデータがよりクリーンに
enterpriseクレジット制限月次上限の可視化 + cloud設定バンドルの適用
リモート制御app-server v2によるペアリング(pairing)とアクセス管理
Web・画像ツールcodeモードのより多くのフローで利用可能

🔗 Codexの変更履歴

オイラーズの予想 — ある推論モデルが80年後に反例を発見

6月4日 — OpenAIは、自社の推論モデルの1つが、80年前のオイラーズの数学予想に対する反例(counterexample)を見つけたと発表した。この発表はOpenAIポッドキャストの第20回エピソードという形で行われ、3人の研究者 — Alex Wei、Hongxun Wu、@wjmzbmr1 — が発見の経緯を語り、数学者とモデルが協力して新たな知見を生み出す方法を説明している。このポッドキャストはX上で227,000以上の閲覧を記録した。

What happened when one of our models found a counterexample to an 80-year-old Erdős conjecture? Researchers @alexwei_, @HongxunWu, and @wjmzbmr1 shared the story on the OpenAI Podcast with @AndrewMayne and explained how mathematicians and models can work together to make new discoveries.

🇯🇵 80年前のオイラーズの予想に対して、私たちのモデルの1つが反例を見つけたとき、何が起きたのでしょうか? 研究者の@alexwei_、@HongxunWu、@wjmzbmr1が、@AndrewMayneとともにOpenAIポッドキャストでこの物語を語り、数学者とモデルがどのように協力して新たな発見を生み出せるのかを説明しました。@OpenAI のX


研究 & CVPR 2026 — Meta SAM 3DとNVIDIA PixelDiTが受賞

CVPR 2026(Computer Vision and Pattern Recognition)では、AI業界発の2つの研究が表彰された。

Meta AI SAM 3D — 最優秀論文名誉賞

6月5日 — Meta AIのSAM 3Dチームは、CVPR 2026で最優秀論文名誉賞Best Paper Honorable Mention)を受賞した。SAM 3DはSegment Anything(SAM)モデルの3次元拡張であり、3Dシーン内の物体セグメンテーションを可能にする。これはロボティクス、拡張現実、自動運転にとって重要な能力だ。

🔗 @AIatMetaの投稿 · 🔗 arXiv論文

NVIDIA PixelDiT — 最優秀論文ファイナリスト

6月6日 — NVIDIA Researchは、PixelDiTPixel Diffusion Transformers)がCVPR 2026の最優秀論文ファイナリストに選ばれたと発表した。このアーキテクチャはパイプラインの革新だ。現在の拡散モデル(Stable Diffusion、FLUXなど)は拡散前にオートエンコーダで画像を圧縮するため累積的な品質低下が生じるが、PixelDiTは前処理を省き、ピクセル空間で単一ステップ処理を行う。このsingle-stageアプローチは中間的な劣化を排し、パイプラインを簡素化する。

🔗 @NVIDIAAIの投稿


NotebookLM — Source Attribution と Cloudflare AI Gateway上のGrok

NotebookLMがSource Attributionを開始

6月4日 — Googleは、NotebookLMに待望のSource Attributionを導入した。これにより、ユーザーは各アーティファクトの生成に使われた正確な式 — クエリ(prompts)とソースの組み合わせ — を確認できる。「Iterate」ボタンでその式を直接調整し、生成物をカスタマイズできるため、生成プロセスが透明で再現可能になる。

項目詳細
機能Source Attribution
主要ボタンカスタマイズ用の「Iterate」
利用可能性NotebookLM(web)

🔗 @NotebookLMの発表

GrokがCloudflare AI Gatewayで利用可能に

6月4日 — xAIは、自社のGrokモデル(LLM、音声、画像、動画)がCloudflare AI Gateway経由で利用できるようになったと発表した。課金はCloudflare経由で一元化され、追加の認証設定や個別のxAI APIキー管理は不要になる。これは、すでにCloudflareエコシステムにいる開発者にとって、統合を大きく簡素化する。

🔗 @xaiの発表


短報

  • Claude Code v2.1.165 — バグ修正、新機能なしで信頼性を改善。🔗 リリース
  • Claude Code v2.1.167 — バグ修正。🔗 リリース
  • Claude Code v2.1.168 — 現時点での最新リリース(6月7日)、バグ修正と信頼性改善。🔗 リリース
  • CopilotでGPT-5.2とGPT-5.2-Codexが廃止へ — 6月5日以降、これらのモデルはGPT-5.5とGPT-5.3-Codexに置き換えられる。GPT-5.2はコードレビューでのみ引き続き利用可能。🔗 変更履歴
  • GitHub Actions向けFix with Copilotを拡張 — Pro、Pro+、Maxの購読者は、失敗したGitHub Actionsジョブをワンクリックで修正できる(分析 + 修正PR)。🔗 変更履歴
  • GitHub予算管理APIがGAに — APIによる予算の完全なライフサイクル管理(作成、更新、削除)、組織、リポジトリ、製品、SKUごとにフィルタ可能なusage summary。🔗 変更履歴
  • GitHub請求利用レポートAPIがGAに — GitHub Enterprise管理者向けにCSVレポートをプログラムから生成可能。🔗 変更履歴
  • Suno — Voicesガイド「Your Voice, Reimagined」 — Voices機能を使うための実践的な6つのヒント(自分の声で歌う機能、有料購読者向け)。🔗 Sunoの記事
  • Codex — 品質向上の更新(6月5日) — カテゴリ別設定検索、再起動間での状態保持(下書き、ズーム、未読インジケーター)、全体的なUIの磨き上げ。🔗 @OpenAIDevsの投稿
  • Codex — カスタムプロフィールカード — プロフィール共有カードが選択したテーマに合わせて変化し、選択した仮想ペット(pet)を含む。🔗 @OpenAIDevsの投稿
  • PerplexityがNemotron 3 Ultra(NVIDIA)を統合 — 長時間稼働エージェント向けのNVIDIAオープンソースモデルがProとMaxの購読者向けに利用可能。🔗 @perplexity_aiの投稿
  • CohereがFar-Field ASR Leaderboardウェビナーに参加(HuggingFace) — Cohere Transcribeは2026年6月11日のFFASR Leaderboardウェビナーで紹介予定。🔗 @cohereの投稿

それが意味すること

低コストの open-weight モデルをめぐる競争が激化している。 DeepSeek-V4 Preview は、1M トークンのコンテキストウィンドウに対する新たな最低価格を設定した。フラッシュ版の出力は $0,28 / 1M tokens、プロ版は $0,87 だ。これらの料金は、同等の機能に対して桁違いに高い料金を請求している欧米のプレイヤーに直接的な圧力を与えている。DeepSeek API の Anthropic 互換性は強いシグナルだ。DeepSeek は、移行コストを下げるために相互運用性を武器にしている。

開発者向けのエージェント型ツールは、運用レベルの成熟に達している。 1週間のうちに、Claude Code は 4つのバージョン(v2.1.163、.165、.166、.168)をリリースし、GitHub Copilot はエージェント型タスク向けに REST API を公開して企業向けプラグインを VS Code に拡張し、OpenAI はマルチエージェント v2 を備えた Codex CLI 0.137.0 を公開した。もはや実験ではない。3者はいずれも、管理されたバージョン管理、クレジット上限、セッション間のセキュリティといったガバナンス機能を提供しており、企業規模での導入を示している。

科学への応用 AI は、最初の測定可能な成果を生み出している。 Anthropic の NMR 研究は、珍しいものをもたらした。一般的な言語モデルと、化学者向けに特化したソフトウェアとの間で、未確認データ上の厳密な比較を行っているのだ。Opus 4.7 は、水素に対する絶対誤差で最良の結果を示し、ピーク形状に関して 80 % の精度を達成した。これは、専門ツールの 26〜35 % を上回る。まだ ChemDraw の置き換えではないが、frontier モデルが特定分野のツールと、特別な fine-tuning なしに競合できることを示す実証だ。

コンピュータビジョンは、学術的な二重評価を受けている。 CVPR 2026 は、SAM 3D(Meta)と PixelDiT(NVIDIA)を同時に選出した。これら 2 つの評価は、補完的な技術方向を反映している。SAM 3D はセグメンテーションを体積へと押し広げ、PixelDiT は autoencoder による前処理を取り除くことで、拡散パイプラインの基盤を再検討している。AI 産業はもはや言語モデルだけに向いているわけではない。3D 視覚認識と高品質画像生成が並行して前進している。


出典