検索

GLM-5.2 のオープンソース MIT、Qwen-Robot Suite と NVIDIA Blackwell が MLPerf を席巻:2026年6月16日の AI

GLM-5.2 のオープンソース MIT、Qwen-Robot Suite と NVIDIA Blackwell が MLPerf を席巻:2026年6月16日の AI

ai-powered-markdown-translator

gpt-5.4-miniでfrからjaへ翻訳された記事。

GitHub でプロジェクトを見る ↗

2026年6月16日 — Z.ai は GLM-5.2 の MIT オープンソース重みを公開し(100万トークンのコンテキスト窓、2段階の推論レベル)、Alibaba Qwen はロボティクス向けの3つの基盤モデルからなる Qwen-Robot Suite を発表、NVIDIA Blackwell は DeepSeek-V3 671B を 8,192 GPU で 2.02分で学習させたものを含む MLPerf Training 6.0 の全ベンチマークを制覇しました。GitHub は Code Quality の有料一般提供(general availability)を 7月20日に 1アクティブ開発者あたり月額 $10 で開始すると発表し、June Pixel Drop では Gemini Omni の動画機能と Pixel デバイス上での音楽生成が追加され、Anthropic の経済研究は Claude Code に対する業務知識の専門性の影響を初めて定量化しました。


Z.ai GLM-5.2 — MIT オープンソース重みが利用可能に

6月16日 — Z.ai(旧 Zhipu AI)は、13日の発表を受けて GLM-5.2 のオープンソース重み を MIT ライセンスで正式公開しました。重みは現在、同社のプラットフォームからダウンロード可能です。

“Introducing GLM-5.2: Frontier Intelligence, Open Weights

  • Significant improvements in coding and agentic tasks
  • Strong long-horizon capabilities with a 1M context window
  • Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance”

🇯🇵 GLM-5.2 の紹介:フロンティア級インテリジェンス、オープンな重み。コーディングおよびエージェント系タスクで大幅に改善。100万トークンのコンテキスト窓により、長い系列でも堅牢な能力を発揮。推論努力には2段階あり、GLM-5.2(max)は限界を押し広げ、GLM-5.2(high)は強力なバランスを提供する。@Zai_org on X

GLM-5.2 の要点:

  • コーディング(coding)およびエージェント系タスクで大幅に改善
  • 100万トークンのコンテキスト窓 — 大規模なコーディングエージェントや長文ドキュメント処理に有用
  • 2つの補完的な推論努力レベル
  • コーディング、ツール利用、推論で GLM-5.1 を上回る
  • chat.z.ai で利用可能
バリエーション推論コンテキストライセンス
GLM-5.2 (max)最大性能100万トークンMIT オープンソース
GLM-5.2 (high)性能と速度の強いバランス100万トークンMIT オープンソース

MIT ライセンスは最も重要な特徴です。これにより商用利用が無制限で認められ、GLM-5.2 は米国のプロプライエタリモデルに依存したくない、または依存できない企業にとって、そのまま使えるものになります。この投稿は数時間で 51万5,000回閲覧され、長いコンテキスト窓を備えたフロンティア級のオープンソースモデルに対するコミュニティの強い関心を示しました。

🔗 Z.ai ブログ — GLM-5.2


Qwen-Robot Suite — 具現化ロボティクス向けの3つの基盤モデル

6月16日 — Alibaba Qwen は、Qwen-Robot Suite を発表しました。これは、ナビゲーション、マニピュレーション、ワールドモデルからなる、異なるかつ補完的な3つの基盤モデルで構成される、具現化知能(embodied intelligence)向けの完全なスタックです。

Qwen-RobotNav — モバイルナビゲーションの専門モデル:

  • 5つのタスクを1つのモデルに統合:指示追従、目的地ナビゲーション(point-goal)、対象物ナビゲーション(object-goal)、物体追跡、自律走行
  • 制御可能な観測プロトコル
  • エージェント系システム向けのツールインターフェース

Qwen-RobotManip — マニピュレーションの専門モデル:

  • 異種ロボット間で統一された状態・行動空間
  • クロスボディ(cross-embodiment)で一貫した学習のためのカメラ座標系デルタ姿勢
  • 38,100時間超のオープンソースコーパスで事前学習

Qwen-RobotWorld — 物理ワールドモデル:

  • 20種類超のロボットボディをカバーする単一モデル
  • 自然言語のアクションインターフェース
  • マニピュレーション、走行、ナビゲーション向けに物理的に整合した未来を予測

各モデルは独立して利用でき、物理世界のツールとして組み合わせることもできます。3つを合わせることで、汎用システムを目指すエージェント向けの低レベル・ツールキットになります。

モデル専門分野主要データ
Qwen-RobotNavマルチタスクナビゲーション(5タスク統合)エージェント系システム向けツールインターフェース
Qwen-RobotManipクロスボディロボット操作オープンソースコーパス 38,100時間超
Qwen-RobotWorld物理ワールドモデル20種類超のロボットボディ

🔗 Qwen-Robot Suite — 発表


NVIDIA Blackwell が MLPerf Training 6.0 を席巻 — 完全制覇

6月16日 — NVIDIA は、MLCommons コンソーシアムが定める AI 学習の業界標準である MLPerf Training 6.0 の全ベンチマークを制覇しました。これは、今回の版で導入された2つの新ベンチマーク、DeepSeek-V3(6,710億パラメータ、MoE アーキテクチャ)と GPT-OSS-20B を含め、すべてのテストで結果を提出した唯一のプラットフォームです。

GB300 NVL72 システム(相互接続された72基の Blackwell Ultra GPU)の性能は目覚ましいものです:

モデルプラットフォームGPU時間
DeepSeek-V3 671B (MoE)GB300 NVL728 1922.02分
GPT-OSS 20B (MoE)GB300 NVL725127.43分
Llama 3.1 405BGB200 NVL728 1927.07分
Llama 3.1 8BGB200 NVL721 0244.46分
Llama 2 70B LoRAGB300 NVL725120.40分
FLUX.1 (画像生成)GB300 NVL7251217.1分
DLRM-dcnv2GB300 NVL72640.67分

FLUX.1(Black Forest Labs の画像生成モデル)が公式ベンチマークに含まれている点は注目に値します。これは、Blackwell インフラが最先端の画像生成モデルを学習させるための基準点であることを裏付けています。

ソフトウェア面では、NVIDIA は NeMo 26.06 スタックに複数の革新を導入しました。MoE 向けの全反復 CUDA グラフ、CuTe DSL によるカーネル融合、アテンションブロック向けの MXFP8 精度、MoE ルーター最適化(カーネル5倍高速化)です。これらのソフトウェア改善により、ハードウェアを変更せずに3か月で DeepSeek-V3 のスループットが 1.3倍 向上し、1,298 から 1,648 TFLOPS/GPU へと改善しました。ハードウェア性能は方程式の一部にすぎない、ということを改めて示しています。

🔗 NVIDIA — MLPerf Training 6.0


June Pixel Drop 2026 — Gemini Omni 動画、音楽生成、Daily Brief

6月16日June Pixel Drop 2026 では、Gemini を Pixel デバイスに直接統合するいくつかの主要機能が導入され、段階的な展開は今後数週間で始まります。

Gemini Omni — AI 動画の作成と編集:Gemini と自然に会話するだけで、テキスト、画像、動画を組み合わせられます。ゼロから始めることも、カメラロールのコンテンツをリミックスすることも、プリセットモデルを使うことも、ユーザーの見た目と声を反映したカスタム AI アバターを作ることさえ可能です。

Gemini での音楽生成:ユーザーがアイデアを説明するか写真を取り込むと、それが歌詞付きのオリジナル音声トラックに変換されます。スタイル、声、テンポは Gemini アプリの「ツール」→「音楽を作成」メニューからカスタマイズできます。

Daily Brief — AI の朝のエージェント:Google AI Plus、Pro、Ultra の全加入者向けに利用可能です(18歳以上、現時点では米国のみ)。このエージェントは、ユーザーが起きる前にその日の予定を整理します。通話をリアルタイムで翻訳する Voice Translate は、Pixel 10a にも拡大されます(フランス語を含む7言語)。

機能利用可能範囲注記
Gemini Omni 動画Pixel(段階的展開)会話による作成/リミックス
音楽生成Pixel(Gemini アプリ)音声 + 歌詞、カスタマイズ可能
Daily BriefGoogle AI Plus/Pro/Ultra、18歳以上、米国AI の朝のエージェント
Voice TranslatePixel 10a7言語 + ヒンディー語はプレビュー
Edit with Ask Photos英国、ドイツ、フランス、スペイン、イタリア会話による写真編集

🔗 June Pixel Drop 2026 — Google 公式ブログ


GitHub Code Quality — 7月20日に一般提供、1アクティブ開発者あたり $10

6月16日 — GitHub は、GitHub Code Quality がプライベートプレビューから、2026年7月20日 に有料製品として一般提供(general availability)に移行すると発表しました。10,000社以上がプレビューに参加しています。

7月20日時点の料金:

コンポーネント料金
アクティブ開発者(committer)あたりのライセンス$10 / アクティブ開発者 / 月
AI 機能(Copilot code review、AI 検出、Copilot Autofix)従量課金
決定的解析 CodeQLGitHub Actions 分数

GA 時点で利用可能になる新機能:

  • 組織全体への展開(管理者トグルは1つ)
  • 組織レベルの品質ダッシュボード
  • ルールセット(rulesets)によるコードカバレッジの強制
  • リポジトリおよび組織ごとの品質スコア
  • 有効化と結果管理のための API

提供状況: GitHub Enterprise Cloud と GitHub Team のみ。GitHub Enterprise Server では利用できません。請求前に利用を停止したい顧客は、7月20日までに自分のリポジトリで Code Quality を無効化できます。

🔗 GitHub Code Quality — GA 発表


Anthropic の経済研究 — コード力より業務知識の専門性が重要

6月16日 — Anthropic は、2025年10月から2026年4月までの約40万セッションの機密分析に基づく、Claude Code の利用に関する 経済研究 を公開しました。AI コーディングエージェントでの成功を専門性がどのように左右するかについて、最初の定量的結果が示されています。

研究の主要結果(著者:Zoe Hitzig, Maxim Massenkoff, Eva Lyubich, Ryan Heller, Peter McCrory):

指標
分析セッション数約400,000
固有ユーザー数約235,000
対象期間2025年10月 – 2026年4月
計画決定(ユーザー)約70%
実行決定(Claude)約80%
タスクの平均経済価値の上昇+25%
検証済み成功率(業務専門家)28–33%
検証済み成功率(初心者)15%
デバッグセッション比率(10月→4月)33% → 19%

中心的結論:典型的なセッションでは、ユーザーが計画決定の約70%(何をするか)を担い、Claude が実行決定の約80%(どのようにやるか)を担います。業務専門家 — 必ずしも開発者である必要はない — は、Claude を5倍多いコンテンツを含む、2倍長いアクションチェーンへ導きます。非技術職(法務、管理職、研究者)の成功率は、ソフトウェアエンジニアとの差が7ポイント未満に収まっています。成功を決めるのはコードの熟達ではなく、業務上の問題の理解なのです。

🔗 Anthropic の経済研究 — Claude Code


Anthropic と OpenAI — 本番エージェントと欧州展開

Claude Managed Agents — 本番導入ガイド

6月16日 — Anthropic の Applied AI チームは、Claude Managed Agents を使ったエージェントの本番導入に関する実践ガイドを公開しました。投稿では、インタラクション面の進化として、従来のチャットボットから、実行環境(stateful runtime environments)へアクセスできる、計画済みで永続的な自律エージェントへの移行が説明されています。6月9日から利用可能な2つの機能は、定義済みスケジュールでのエージェント実行と、環境変数を vaults に保存することです。

🔗 Claude Managed Agents の構築

Claude Code v2.1.178 — 粒度の細かい権限と入れ子の skills

6月15日 — Claude Code v2.1.178 は、権限ルール向けの構文 Tool(param:value) を導入しました。たとえば、Opus のサブエージェントをブロックするために Agent(model:opus) を使えます。.claude/skills/ ディレクトリ内の skills は、それらのフォルダ内で作業すると自動的に読み込まれます。auto mode は起動前にサブエージェントの起動を分類器で評価するようになり、サブエージェントが事前レビューなしにブロックされたアクションを要求できてしまう抜け穴を塞ぎました。

🔗 Claude Code v2.1.178

EEA、英国、スイスでの Codex app — Computer Use、Memories、Chronicle

6月16日 — OpenAI は、欧州経済領域(EEE)、英国、スイスで Codex の4つの高度機能を展開します。Computer Use(macOS + Windows)、Codex Chrome 拡張機能MemoriesChronicle です。

Computer Use により、Codex はデスクトップアプリケーションとやり取りできます。つまり、見る、クリックする、テキストを入力することが可能です。Chrome 拡張機能は、接続されたブラウザのコンテキストを必要とするタスクを、バックグラウンドで複数タブにまたがって処理できます。Memories は、繰り返し現れるリポジトリの設定や慣習を記憶しますが、規制順守のため3地域では デフォルトで無効 になっています。Chronicle は、Pro の macOS 加入者限定のオプトインプレビューで、Codex が画面の直近コンテキストから記憶を構築するのを助けます。これらの機能は、EEE/UK/CH 以外の Enterprise ユーザーにはすでに利用可能でした。

🔗 OpenAI — Codex EEA/UK/スイス展開

OpenAI Deployment Simulation — リリース前に挙動を予測する

6月16日 — OpenAI は、自社の手法 Deployment Simulationデプロイメントシミュレーション)を公開しました。これは、過去のデプロイから収集した実際の匿名化会話を候補モデルで再実行し、本番投入前に望ましくない挙動を検出するというものです。GPT-5-series Thinking のデプロイ(約130万件の会話)で検証したところ、予測の中央値誤差は 1.5× で、合成評価よりも大幅に優れていました。この手法により、GPT-5.1 のリリース前に “calculator hacking”(reward hacking の一形態)を検出することができました。

🔗 Deployment Simulation — OpenAI

Codex CLI 0.140.0 — /usage, /import が Claude Code、Bedrock auth に対応

6月15日 — Codex CLI の 0.140.0 版では、いくつかの重要な機能が追加されました。/usage は、アカウントの毎日・毎週・累計のトークン活動を表示します。/import により、Claude Code から設定、プロジェクト設定、最近の会話を選択的に取り込めるようになりました。これは、競合する 2 つのツール間での直接的な相互運用性です。codex delete は、セキュリティ確認と関連サブエージェントのクリーンアップを伴って、セッションを完全に削除します。管理された Amazon Bedrock 認証は、API キーをローカルで暗号化して保存し、MCP の OAuth 資格情報にも対応します。加えて、MCP の信頼性改善(起動時の一時的な失敗に対する再試行)と、破損した SQLite データベースの自動復旧も行われます。

🔗 Codex CLI 0.140.0 — GitHub リリース


Meta AI — Muse Spark を搭載した Facebook の AI モード

6月16日 — Meta は Facebook に新しい人工知能ツールを展開します。AI Mode は、Meta AI を活用した新しい検索モード(Muse Spark 搭載)で、Meta のアプリ上でユーザーが公開している内容、つまりグループやリールに基づいて応答をアンカーし、一般的な結果ではなく文脈化された洞察を提供します。ニュースフィードまたは検索からアクセスできます。

新しいクリエイティブツールには、コラージュテンプレート(cutout templates)を使ったカメラロールからのシェア提案、動画のトランジション効果、服装や髪型を仮想的に変更できる写真プリセット(photo presets)、そして Stories でスポーツジャージを仮想的に着用できる “Wear It” オプションが含まれます。これらの機能はすべてオプトインで、無効化できます。

🔗 Meta — Facebook の新しい AI ツール


NVIDIA SpatialClaw — 学習不要の空間推論エージェント

6月16日 — NVIDIA Research は、SpatialClaw を公開しました。これは、追加学習なしの training-free な視覚的空間推論エージェントです。あらかじめ定義された固定ツール群を呼び出すのではなく、エージェントは永続的なノートブック内で直接 Python を記述し、知覚モジュールを動的に組み合わせながら、各ステップで戦略を見直します。出力は、NumPy や SciPy で再利用可能な Python 変数になります。

結果として、直近の先行エージェントと比べて、6 種類の異なるモデルアーキテクチャすべてで一貫して、20 個の視覚的空間推論ベンチマークにおいて +11.2 ポイント を達成し、ベンチマークごとの特別な調整は不要でした。

🔗 SpatialClaw — @NVIDIAAI sur X


Cohere — Anthropic に対する米国の制限後に問い合わせが急増

6月15日 — 生成 AI 企業の Cohere は、米国の Anthropic へのアクセス制限指令(6月13日に取り上げ)を受け、代替先を探す企業からの問い合わせ(inbounds)が非常に多いと報告しています。同社はこれに対して、Polymarket のツイート “The world needs more Canada 🇨🇦” を引用してユーモアを交えました。このツイートは 56,000 回表示、797 いいねを獲得しました。この動きは、米国の指令が非米国の主権的プロバイダーにとって直接的な商機を生み出していることを裏付けています。

🔗 Cohere — ツイート


GitHub Models が新規顧客向けに終了

6月16日 — GitHub は GitHub Models の段階的な終了を発表しました。6月16日以降、新規顧客(既存利用のない組織および企業)は、無料プランでも有料プランでもこのサービスにアクセスできなくなります。現時点でアクティブな利用がある既存顧客は影響を受けず、引き続きプレイグラウンド(playground)、API、利用可能なモデルを使えます。GitHub は、完全終了の詳細なスケジュールは後日案内するとしています。AI モデルへのアクセスを必要とする新規プロジェクトについては、GitHub は広範なモデルカタログを提供する Azure AI Foundry を案内しています。

🔗 GitHub Models retirement


短報

  • Claude Code v2.1.179 — 安定性修正 9 件6月16日): ストリーム途中(mid-stream)での接続切断の保持、Windows Terminal と VS Code の WSL2 でのホイールスクロールの修正(v2.1.172 からの回帰)、大きなディレクトリツリーでの Linux サンドボックス修正。🔗 v2.1.179

  • Gemini Trusted Tester Program — 受付開始: Google は、公開リリース前の未公開 Gemini 機能を試したいパワーユーザー向けに、限定人数の枠を開放します。🔗 登録

  • Gemini — 70 以上の言語に対応する多言語マイク(Android および iOS): マイクアイコンが、設定を変更せずに自由に混在させながら 70 以上の言語をサポートするようになりました。@joshwoodward(Gemini App の Product Director)による告知。

  • GitHub Code Quality — 組織単位でワンクリック有効化6月16日): 組織管理者は、セキュリティ設定の 1 つのトグルで、すべてのリポジトリに対して Code Quality を有効化または無効化できます。🔗 Changelog

  • Copilot usage metrics — サーバーテレメトリによる拡張6月15日): Copilot Enterprise の利用レポートに、クライアント側テレメトリに加えて、サーバー側で検出されたアクティブユーザーが統合され、日次および 28 日間レポートにおける DAU のカバレッジが改善されました。🔗 Changelog

  • Manus — 実行中のメッセージキュー6月16日): Manus では、タスク実行中にエージェントへ送るメッセージをキューに入れられるようになりました。メッセージは現在のタスク終了後、順番に処理されます。🔗 Annonce

  • ChatGPT iOS 1.2026.1606月15日): workspace ファイルエクスプローラー、フォルダセレクター、差分表示コントロール、チャットまたはグローバルでの MCP 承認、Codex メッセージと計画における LaTeX レンダリング。


何を意味するか

GLM-5.2 の MIT ライセンスでの重み公開と、3 つのロボティクスモデルからなる Qwen-Robot Suite は、米国勢が依然として大部分を独占している領域において、中国のオープンソース提供が加速していることを示しています。1M トークンのコンテキスト窓を MIT ライセンスで備えた GLM-5.2 は、主権的な代替を求める企業にとって商用モデルの直接的な競合として位置づけられます。まさに、Anthropic へのアクセス制限を含む米国の指令が戦略的重要性を可視化した、そのニッチを狙うものです。Cohere が示した問い合わせ急増がそれを裏付けています。ロボティクスはこの競争の次の主戦場です。Qwen-Robot Suite は navigation-manipulation-world model の完全なスタックを提供し、一方で NVIDIA Research の SpatialClaw は、ファインチューニングなしでも高度な空間推論が達成可能であることを示しています。これらは相補的な 2 つのアプローチであり、次世代のエージェント型ロボットシステムのアーキテクチャを描き出しています。

ハードウェア面では、MLPerf Training 6.0 の結果が、Blackwell アーキテクチャの産業規模での優位性を裏付けています。DeepSeek-V3(6710億パラメータ)を 8,192 GPU で 2 分で学習させるのは学術的な偉業ではなく、クラウドデータセンターに展開された実運用の生産能力です。3 か月でハードウェアを変えずに DeepSeek-V3 のスループットを 1.3× 向上させたソフトウェア面の改善は、AI 性能競争がチップだけでなく、ソフトウェアスタック(NeMo、CuTe DSL、MXFP8)の競争でもあることを思い出させます。この力学は、既に優位な立場にある企業の地位をさらに強化します。

Anthropic による Claude Code の経済研究は、重要で直感に反する示唆を与えています。法務、経営、科学といったドメイン知識が、コードエージェントでの成功を、コードそのものの習熟とほぼ同じくらい左右するというのです。検証済みの成功率では、エンジニアと、自分の専門分野では非開発者である専門家との間に、わずか 7 ポイントの差しかありません。これはプロダクトチームにとって構造的に重要な情報です。AI コーディングツールの対象はもはや開発者だけではなく、インターフェース設計もそれを前提にしなければなりません。

開発者向けツールの面では、6月16日は複数の収束するシグナルが集中しています。GitHub Code Quality の有償 GA(アクティブ開発者あたり $10)、EEE/UK/スイスでの Computer Use 対応 Codex 利用可能化、Claude Code v2.1.178 の粒度の細かい権限、そして OpenAI の Deployment Simulation 手法です。コード品質とデプロイ安全性は、研究テーマから課金対象の製品へと移行しています。これは、開発チーム向け AI ツール市場の成熟を反映する正規化です。


ソース