ai-powered-markdown-translatorgpt-5.4-miniでfrからjaに翻訳された記事。
2026年6月1日は、近年のAI史において最も濃密な一日のひとつとして記憶されるだろう。AnthropicはSECへの機密S-1提出で上場への一歩を進め、同時に「Physical AI」の大きな波が押し寄せた。NVIDIA Cosmos 3、Cosmos Coalition Runway+NVIDIA、Luma OPAL Lab、MiniMax M3、Qwen-VLA、Qwen3.7-Plusである。同時にOpenAIは、パンデミック対策向けにRosalind Biodefenseを展開し、カリフォルニア州のTFAIAおよびEU AI Actに整合したガバナンス枠組みを公開した。
Anthropic、SECへ機密扱いでS-1フォームを提出
6月1日 — Anthropicは、普通株の新規株式公開(IPO)を見据えて、米国証券取引委員会(SEC)にS-1フォームによる登録届出書の草案を機密扱いで提出した。この機密提出は、SECが公開募集の前に文書を審査するために必要な初期段階の手続きである。
| 項目 | 値 |
|---|---|
| 提出種別 | 機密S-1フォーム |
| 規制当局 | SEC(米国) |
| 株式の種類 | 普通株 |
| 価格 / 株式数 | まだ未確定 |
| 法的ステータス | 予備提出 — 売却の申込みではない |
| 日付 | 2026年6月1日 |
発表によると、SECの審査完了後にAnthropicが上場する選択肢は維持されるが、最終的な実施は市場環境やその他の要因に左右される。このS-1提出は、シリーズHのクローズ(650億米ドル、ポストマネー評価額9,650億米ドル)と、2026年5月中旬時点で年間売上高が470億米ドルを超えたとされる数字に続く動きである。
Anthropicは引き続き公益会社(PBC — Public Benefit Corporation)であり、仮に上場してもその地位を維持する意向だ。これは、利益追求に加えて公共の利益に関する義務を課す、希少な法的区分である。
NVIDIA Cosmos 3 — Physical AI向けの初の完全オープンなオムニモデル
6月1日 — NVIDIAはCosmos 3を発表した。これは、物理AI向けに完全に公開された世界初のオムニモデルである。言語、画像、動画、音声、アクション生成を一つのモデルに統合しており、世界初の試みとなる。
| バリエーション | パラメータ | 利用可能性 |
|---|---|---|
| Cosmos 3 Super | 32B | 発表と同時にオープンソース |
| Cosmos 3 Nano | 8B | 発表と同時にオープンソース |
このモデルは、ネイティブな視覚推論(native vision reasoning)、世界生成(world generation)、アクション生成(action generation)を標準搭載している。Artificial Analysisによれば、Cosmos 3はリリース初日からテキストから画像、画像から動画生成において、open-weightモデルの中で即座に第1位に位置づけられた。重みはHugging FaceとNVIDIA NGCで公開されている。
“Introducing Cosmos 3: Our latest frontier model for Physical AI. Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.”
🇯🇵 NVIDIAはCosmos 3を発表しました。これは、物理AI向けの最新フロンティアモデルです。Cosmos 3は、ネイティブな視覚推論、世界生成、アクション生成を備えた、世界初の完全オープンなオムニモデルです。 — @NVIDIAAI on X
Cosmos Coalition — world modelsのためのRunway + NVIDIAの世界的イニシアチブ
6月1日 — Runwayは、Cosmos Coalitionの創設メンバーとしてNVIDIAに加わった。これは、物理AI向けのフロンティアなworld modelsを構築し、open-sourceで利用可能にするために、主要なAI研究機関を結集する世界的な取り組みである。
目的は、研究機関や産業界のあらゆるチームが、これらのモデルを生産的なシステムのために利用・改変・組み合わせできる共通のオープンエコシステムを作ることにある。連合には、半導体やハードウェアのメーカーとの連携も含まれる。
“Introducing the Cosmos Coalition. A new global initiative with NVIDIA and leading AI labs to build and open-source frontier world models for physical AI.”
🇯🇵 Cosmos Coalitionの発表。NVIDIAと主要なAI研究機関による新たな世界的イニシアチブで、物理AI向けのフロンティアなworld modelsを構築し、open-source化します。 — @runwayml on X
Cosmos 3と連動したこの発表は戦略的な転換点を示している。NVIDIAは、限られたクローズドなプレイヤーに資源が集中する状況に対し、open-sourceの物理AIを世界的な技術主権の争点として位置づけている。
MiniMax M3 — コーディング最前線・マルチモーダル・1Mコンテキストを統合した初のopen-weightモデル
6月1日 — MiniMaxはM3を発表した。これは、3つのフロンティア能力を同時に備える初のopen-weightモデルである。数時間で170万ビューを獲得し、今年最も注目されたopen-source公開のひとつとなった。
| 能力 | 詳細 |
|---|---|
| Coding & Agentic frontier | 59.0% SWE-Bench Pro、66.0% Terminal Bench 2.1 |
| 1Mトークンのコンテキスト | MiniMax Sparse Attention |
| ネイティブマルチモーダル | 学習の最初の段階から対応 |
完全ベンチマーク:
| ベンチマーク | スコア |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BU Bench (browser use) | +26% vs 前回 |
M3は、computer-use agents と長時間のエージェントワークフロー向けにネイティブ設計されている。重みと技術レポートは、リリースから約10日後に公開される予定だ。専用IDEのMiniMax Codeも同時にリリースされ、code.minimax.ioで利用できる。初日のローンチパートナーには、Qubrid AI(GPUクラウド基盤)とSimular(自律エージェント)が含まれる。
Luma OPAL Lab — 汎用ロボティクス向けのオープンなPhysical AI研究所
6月1日 — Lumaは、ロボティクスの汎化に特化したオープンリサーチ研究所、OPAL Lab(Open Science Physical AI Lab)の設立を発表した。
創設者のAmit(@gravicle)は、現在の物理AIが抱える中心課題をこう指摘する。大規模言語モデルは未知のタスクにも一般化できるのに対し、ロボットは特定の環境で特定のタスクを再現することしかできない。ロボティクスはデータ不足に苦しみ、それが汎化危機を生み出している。
“We are launching Open Physical AI Lab at Luma to solve generalization in robotics. We believe general physical AI is the most consequential problem to solve to improve life on Earth.”
🇯🇵 ロボティクスにおける汎化問題を解決するため、LumaでOpen Physical AI Labを立ち上げます。私たちは、一般的な物理AIこそが、地球上の暮らしを改善するために解決すべき最重要課題だと考えています。 — @gravicle on X
Lumaは、マルチモーダルAIに関する4年間の基礎研究(3D、画像、動画、統合生成)と、インターネット規模のマルチモーダルデータ処理基盤を活用している。OPAL Labの原則は、オープンサイエンス、手法と基盤の誰でも利用可能な公開、学術界との協力、産業パートナーシップ、そして安全性評価である。メッセージは明確に政治的でもある。世界の物理知能インフラが少数の企業の手に集中することは、人類に対する深刻な脅威だというのだ。
Qwen3.7-Plus — 視覚、コーディング、長文コンテキストを備えたAlibabaのマルチモーダルエージェント
6月1日 — Alibaba Tongyi Labは、最も高度なマルチモーダルエージェントモデルQwen3.7-Plusを公開した。Qwen3.7のテキスト基盤をもとに構築され、視覚と言語を統合した、汎用的で単一のエージェント基盤となっている。
主要ベンチマーク:
| ベンチマーク | Qwen3.7-Plus | GPT-5.4 | Claude Opus 4.6 Max | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal Bench 2.0 | 70.3 | — | 65.4 | — |
| SWE-bench Verified | 77.7 | — | 80.8 | — |
| GPQA Diamond | 90.3 | — | 91.3 | — |
| ScreenSpot Pro | 79.0 | 67.4 | 49.5 | 68.1 |
| AndroidWorld | 81.0 | — | 62.0 | 70.7 |
| BabyVision | 70.4 | 53.1 | 12.6 | 55.9 |
主な能力は4つある。GUI+CLI のハイブリッドエージェント(画面を認識し、アプリを操作する)、マルチモーダルなコーディングおよび生産性アシスタント(フロントエンドのモックアップから複雑なエンジニアリングまで)、視覚エージェント(認識、推論、位置特定、ウェブ検索で強化されたQ&A)、そしてClaude Code、OpenClaw、Qwen Code、その他の任意のエージェント環境を通じたマルチ環境汎化である。
利用可能性: Alibaba Cloud Model Studio、OpenAI互換API、Anthropicプロトコル(ANTHROPIC_BASE_URL を通じてClaude Codeで直接使用可能)。
Rosalind Biodefense — OpenAIがGPT-Rosalindを防御的生物学に開放
5月29日 — OpenAIは、ライフサイエンス向け推論モデルGPT-Rosalindを活用し、防御的生物学を巡る2つの主要施策を発表した。
| 組織 | 分野 | 種別 |
|---|---|---|
| Fourth Eon | バイオセキュリティ・スクリーニング、DNA合成 | Rosalind Biodefense開発者 |
| SecureDNA | 生物学的安全性 | Rosalind Biodefense開発者 |
| Lawrence Livermore National Laboratory | 医療対抗手段 | 政府パートナー |
| Johns Hopkins APL | タンパク質工学、治療法 | 政府パートナー |
| CEPI | パンデミックワクチン、エボラ対応 | 政府パートナー |
Rosalind Biodefense は、学術機関、非営利組織、防御目的のミッションを持つ企業、政府チームに開かれた開発プログラムである。OpenAIはGPT-Rosalindへのアクセス費用を負担し、疫学モデリング、早期検知、スクリーニング、パンデミック準備、医療対抗手段に関するプロジェクトを支援する。
“Advances in biology can strengthen our ability to prevent, detect, and respond to biological threats. Our goal is to help build a more robust ecosystem — giving trusted defenders frontier AI to develop and operate new defenses for public health and biodefense.”
🇯🇵 生物学の進歩は、生物学的脅威を予防し、検知し、対応する私たちの能力を強化できます。私たちの目標は、信頼できる防衛側にフロンティアAIを提供し、公衆衛生とバイオディフェンスのための新たな防御を開発・運用できる、より強固なエコシステムの構築を支援することです。 — @OpenAI on X
米国および同盟国の政府パートナー向けにGPT-Rosalindへのアクセスを拡大することも同時に発表され、CEPIの「100 Days」ワクチン加速ミッションの一環として、進行中のエボラ流行への対応も含まれる。
🔗 Rosalind Biodefense — OpenAI
Claude Code v2.1.153 から v2.1.159 — 5つのアップデート、5月28日以降
5月29日 – 6月1日 — Anthropicは、Opus 4.8のリリース後数日間でClaude Codeの5つのバージョンを公開した。
| バージョン | 重要ポイント |
|---|---|
| 2.1.153 | marketplace向けの skipLfs オプション、claude doctor の改善、macOS/WindowsのMCP/agent修正 |
| 2.1.156 | 重要な修正 — Opus 4.8のthinking blocksがAPIエラーを引き起こしていた |
| 2.1.157 | .claude/skills/ からのプラグイン自動読み込み、plugin init コマンド、セッション途中での EnterWorktree |
| 2.1.158 | Bedrock、Vertex、FoundryでのOpus 4.7およびOpus 4.8向けAuto Mode(CLAUDE_CODE_ENABLE_AUTO_MODE=1) |
| 2.1.159 | 内部インフラの更新、目に見える変更なし |
最も注目すべきは2.1.157である。.claude/skills/ に配置されたプラグインは、marketplaceを経由せず自動的に読み込まれるようになり、EnterWorktree はセッション中にClaude管理のworktree間を切り替えられる。2.1.158では主要クラウドプラットフォーム上でAuto Modeが追加され、Claude Codeのエンタープライズ展開が強化された。
Gemini 3.5 Flash と Gemini Omni が一般提供に
5月29日 — Googleは、Gemini OmniとGemini 3.5 Flashの動作を9本の動画デモで紹介しつつ、Gemini 3.5 Flashの一般提供(general availability)を発表した。
Gemini 3.5 Flashの展開: GeminiアプリおよびSearchのAI Modeでの既定モデル(世界全体)、Google Antigravity、Google AI StudioのGemini API、Android Studio、Gemini Enterprise Agent Platform、Gemini Enterpriseで利用可能。
Gemini Spark: Gemini 3.5搭載の24時間稼働パーソナルAIエージェント。現在は米国のGoogle AI Ultra加入者全員が利用可能で、Gmail、Docs、Slides、Workspaceに統合されている。
Gemini Omni Flash: GeminiアプリとGoogle FlowでGoogle AI Plus、Pro、Ultra加入者に提供。YouTube ShortsおよびYouTube Create Appの利用者には無料で提供され、開発者向けAPI展開はその後数週間以内に予定されている。
Qwen-VLA — 11種類のロボットに対応する視覚・言語・行動エージェント
5月29日 — Tongyi Labは、一般的な具現化知能(general embodied intelligence)向けの統合Vision-Language-Action(VLA)モデル、Qwen-VLAを公開した。
アーキテクチャ: Qwen3.5-4B(言語・視覚バックボーン) + 1.15BのDiTデコーダーにより、視覚認識と言語から直接アクションを生成する。モデルは、物体操作、空間内ナビゲーション、軌道予測を単一の枠組みに統合している。
embodiment-aware prompts を使うことで、同じモデルが11種類のロボット形態—単腕、両腕、ヒューマノイドプラットフォーム—上で、policy headsやタスク固有のアーキテクチャなしに動作する。このツイートは2日で310万ビューを記録し、ロボティクス界の強い関心を示した。
Copilot — メトリクス API に AI 導入コホートを追加
5月29日 — GitHub は Copilot 使用メトリクス API を拡張し、AI 導入コホートの仕組みを追加した。各アクティブユーザーは、28日間のローリングウィンドウで算出される次の4つのフェーズのいずれかに分類される。
| フェーズ | 名称 | 基準 |
|---|---|---|
| 0 | コホートなし | 十分なエンゲージメントがない |
| 1 | コード優先 | コード補完および/または IDE エージェントモード |
| 2 | エージェント優先 | 1つの GitHub エージェント面(クラウドエージェント、コードレビュー、CLI) |
| 3 | マルチエージェント | 2つ以上のエージェント面、または GitHub Copilot アプリ |
フェーズごとに公開されるメトリクス: アクティブユーザー、インタラクション、コード生成と受け入れ、追加/削除された行数、作成/マージ/レビューされたプルリクエスト、マージまでの中央値時間。enterprise 管理者と organization 所有者が利用可能。この仕組みにより、Copilot 導入の実際の成熟度を測定し、開発者が高度なエージェント的利用へ進む過程を追跡できる。
🔗 GitHub Changelog — Copilot usage metrics API
ElevenLabs がギリシャ政府と MOU を締結
5月28日 — ElevenLabs は、ギリシャ首相(@PrimeministerGR)とデジタル変革担当大臣(@papastergiougr)の立ち会いのもと、ギリシャ政府と了解覚書を締結した。目的は3つで、音声 AI による公共サービスへのアクセス改善、観光振興、そしてギリシャ語の言語遺産保護である。この政府との提携は、ElevenLabs が欧州の公共部門へ進出するために、可視性の高い制度的ユースケースに注力している戦略を示している。
Frontier Governance Framework — OpenAI が TFAIA と EU AI Act に実務を整合
5月28日 — OpenAI は Frontier Governance Framework を公開した。これは内部の Preparedness Framework を具体的な規制上の義務へと落とし込んだ公開ガバナンス文書である。主な対象は、カリフォルニア州の Transparency in Frontier AI Act(TFAIA)と、EU AI Act の汎用 AI 向け実施規範である。
このフレームワークは、サイバー攻撃、CBRN(化学・生物・放射線・核)、有害な操作、制御喪失の各分野におけるリスクの評価と軽減を扱う。また、モデル報告義務、インシデント対応、外部専門家の活用、更新メカニズムも含む。OpenAI は、Preparedness Framework が引き続き内部の基盤であり、一部の実務は現行の法的要件を上回ると説明している。
🔗 Frontier Governance Framework
信頼できる第三者評価ガイド — 手法と管理すべき5つのバイアス
5月29日 — OpenAI は、フロンティア AI モデルに対する厳密な第三者評価のための方法論ガイドを公開した。文書は、もともとチャットボット向けに設計された評価は、ツールを使って長い軌道で行動できるエージェント的システムにはもはや適していない、という認識から始まる。
ガイドは、評価が支えるべき3種類の主張を区別する。すなわち、能力の引き出し(モデルが最良条件で何をできるか)、防御の堅牢性(攻撃への耐性)、そしてシステム間比較である。中心概念は「ハーネス」(モデル周辺の実行環境)であり、その選択は結果を実質的に変えうる。OpenAI は、複数ステップのサイバー評価における GPT-5.5 の性能に対するコンテキスト圧縮の影響を例に挙げている。
識別された5つの妥当性バイアスは、reward hacking(抜け道の悪用)、実際の能力を隠す拒否、汚染(ベンチマークの記憶)、壊れた問題(不可能または採点不備の課題)、および sandbagging(検知された評価で意図的に低性能を出すこと)である。OpenAI は、第三者評価者に最大限の能力を引き出すための指示を提供し、推論のトレースを共有することを約束している。
Grok Imagine Extend — 連続動画拡張
5月29日 — Grok Imagine は Extend を発表した。これは、既存の動画や画像から滑らかな遷移を伴う連続動画を作成できる機能である。この機能は Grok Imagine のインターフェース内で直接利用できる。@imagine の投稿は @grok により再投稿され、701,000回の閲覧に達した。この発表により、Grok Build と grok-build-0.1 API に並ぶ Grok の創作ツール群が強化された。
Windows 上の Codex Computer Use とモバイル操作
5月29日 — OpenAI は、Codex の「computer use」機能が Windows で利用可能になったと発表した。エージェントは画面を見て、クリックし、Windows アプリケーションに文字を入力できるため、ネイティブテスト、シミュレーター上のフロー、GUI でのみアクセスできるバグ修正への道が開かれる。同時に、ChatGPT モバイルアプリは Windows に対応した Codex を統合した。電話からタスクの起動、監視、操作ができ、作業は PC 上で継続される。OpenAI はこの機能を「初期体験」と位置づけており、欧州経済領域、英国、スイスでは利用できない。
🔗 Windows 上の Codex Computer Use
ブリーフ
-
Salesforce + Claude Code — Boris Cherny (@bcherny) が、Claude Code のエージェント的利用に関する Salesforce の事例を共有した。もともと231日と見積もられていた移行が13日で完了し、21のエンドポイントが100%のテストカバレッジを達成、PR 数の増加にもかかわらずインシデントは5%減少した。 🔗 ソース
-
Google I/O 2026 — AI のメイキング — Google は、Gemini Omni、Nano Banana、Lyria 3、Antigravity を使って Google I/O 2026 のクリエイティブ体験を制作した方法を詳しく説明した。内容は、アニメ短編、ビジュアルアイデンティティ、インタラクティブな音楽プレショー、生成ゲームなど。 🔗 ソース
-
Gemini CLI v0.44.0 — 統合された Auto Mode(特化モードの統合)、Sublime Text と Emacs Client のネイティブ対応、プログラム可能な新しい TUI テストツール。 🔗 ソース
-
GitHub Copilot — auto モードで評価中のモデル — 個人ユーザー(Free、Pro、Pro+)は、自動選択
autoを通じて GA 前のモデルにアクセスできるようになった。無効化オプションは設定で利用可能。 🔗 ソース -
ElevenLabs Summit ワルシャワ — ElevenLabs の共同創業者 Mati が発表した、同社史上最も表現力豊かな音声モデルのプレビュー。これはプレビューのみで、公開アクセスはまだ発表されていない。 🔗 ソース
-
Cohere Command A+ — 翻訳ベンチマーク — Command A+ は、WMT24++ において Mistral Medium 3.5、DeepSeek、gpt-oss、Claude Opus 4.6 を上回り、Google Translate も超えた。確認された改善: フランス語 +2.4pt、スペイン語 +1.9pt、ドイツ語 +0.9pt。 🔗 ソース
これが意味すること
Anthropic の財務動向と業界の統合。 Anthropic の機密 S-1 提出は、今週もっとも構造的に重要なニュースである。これは、65億米ドルのシリーズH調達、1兆ドル近いバリュエーションという異例の成長文脈の中で行われ、フロンティア AI の大手企業が公開市場を本格的に検討し始めていることを示している。PBC(Public Benefit Corporation)の地位を維持することは強いコミットメントであり、Anthropic は、IPO が長期的な安全性ミッションと両立できることを示そうとしている。この前例は、OpenAI や同じ道をたどる可能性のある他の企業にも影響を及ぼすだろう。
Physical AI の波 — 現実世界で動く AI へ。 6月1日は、Physical AI をめぐる顕著な収束を示した。NVIDIA Cosmos 3(ロボットとエージェント向けの初の open-weight omni-model)、Cosmos Coalition(Runway+NVIDIA のオープンエコシステム)、Luma OPAL Lab(ロボットの汎化に関するオープン研究)、MiniMax M3(1M コンテキスト + ネイティブなマルチモダリティ)、Qwen-VLA(統一アーキテクチャ下で11種類のロボットに対応)、Qwen3.7-Plus(インターフェース上で GUI+CLI エージェントが動作)である。この集中は偶然ではない。次の AI フロンティアが物理空間での行動であり、そこではオープンソースが中心的役割を果たすという認識が広がっていることを反映している。とりわけロボティクスと computer use のベンチマークでは、クローズドモデルとオープンモデルの競争が激化している。
AI ガバナンスと安全性が成文法に入る。 OpenAI の Frontier Governance Framework の公開は、カリフォルニア州の TFAIA と EU AI Act に整合し、さらに第三者評価ガイドが公開されたことで、大きな転換点を示した。大手 AI 企業はもはや、自社ルールを内部だけで定義しているわけではない。具体的な法制度に合わせ、評価方法論を公開しているのである。Rosalind Biodefense の取り組みは、このガバナンスのもう一つの側面、つまりフロンティア AI を社会防衛(パンデミック対策、バイオセキュリティ)に役立てることと、それに応じた制御を示している。
開発者向けツールは加速し、細分化している。 Claude Code は4日間で5つのバージョンを出し、その中には Bedrock/Vertex/Foundry 上での Auto Mode とローカルプラグインの自動読み込みが含まれる。Gemini CLI v0.44.0 は Auto Mode を統合し、IDE 連携を拡張した。GitHub Copilot は、組織が AI 導入の実態成熟度を測定できるよう、導入分類(4フェーズ、28日ウィンドウ)を洗練させている。開発者は今や、密度が高く急速に進化するエージェントツール群を手にしている。問題はもはやモデルへのアクセスではなく、チームがこれらのツールを一貫性のある、かつ測定可能な方法でワークフローに統合できるかどうかである。
ソース
- Anthropic — SEC 機密 S-1 提出
- X 上の NVIDIA Cosmos 3
- Cosmos Coalition — X 上の Runway
- X 上の MiniMax M3
- X 上の Luma OPAL Lab
- X 上の Luma OPAL Lab — @gravicle
- Qwen3.7-Plus — Qwen ブログ
- X 上の Qwen-VLA
- Rosalind Biodefense — OpenAI
- Frontier Governance Framework — OpenAI
- 信頼できる第三者評価 — OpenAI
- Codex Computer Use Windows — OpenAI の X 上投稿
- X 上の Grok Imagine Extend
- Claude Code Releases
- Gemini Omni と 3.5 Flash — Google Blog
- Copilot usage metrics API — GitHub Changelog
- X 上の ElevenLabs ギリシャ MOU
- X 上の ElevenLabs Summit ワルシャワ
- X 上の Cohere Command A+ 翻訳
- Gemini CLI changelog
- Google I/O 2026 — AI のメイキング
- Salesforce + Claude Code — X 上の @bcherny
- GitHub Copilot — auto で評価中のモデル