Grok Build ベータ版、Vatican の Anthropic、ElevenLabs Music v2

2026年5月25日と26日は、xAI が Grok Build（40.8百万ビュー）で CLI エージェント市場に鮮烈に参入した一方で、Anthropic はエージェントの安全性に関するエンジニアリング記事を公開し、共同創業者が Vatican で発言するという出来事が起きた。並行して、ElevenLabs は Music v2 を半額の価格でリリースし、Runway は動画 IA においていわゆる「不気味の谷」を自社いわく越え、OpenAI と Alibaba もそれぞれエージェントツールの注目すべき更新を公開した。

Grok Build — xAI がターミナル用コードエージェントを発表

2026年5月25日 — xAI は、ターミナルから直接動作するコーディングエージェント（coding agent）である Grok Build のベータ版を発表した。この発表は、数時間で X 上で 40.8百万ビューを記録し、ここ数か月で xAI の投稿の中でも最も拡散したものの一つとなった。

Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.

🇯🇵 Grok Build は現在、すべての SuperGrok および X Premium+ ユーザー向けにベータ版として利用できます。Plan Mode を使い、Imagine で画像や動画を作成し、CLI を使って自動化やオーケストレーターを構築してください。開始するには x.ai/cli にアクセスしてください。 — @xai on X

ツールは 1 コマンドでインストールできる： curl -fsSL https://x.ai/cli/install.sh | bash

SuperGrok および X Premium+ の加入者は、追加のサブスクリプション料金なしで即座に利用できる。

主な機能

機能	説明
Plan Mode	変更前の構造化された計画 — 各変更は明示的な承認があるまでブロックされる
Skills	再利用可能なワークフロー（AGENTS.md、プラグイン、フック、MCP）で、名前または自動で呼び出し可能 — 作成には `/skillify`
Subagents	検索、構築、レビューのために並列実行される専門エージェント
Plugins	共有マーケットプレイス：Linear、Sentry、Postgres、MCP 経由のブラウザ
Git integration	ターミナルから stage、commit、push、ブランチ管理
Code review	PR を開く前の行単位フィードバック
Memory	セッション間での意思決定の永続化
Headless mode	CI/CD パイプラインで利用可能

Claude Code とのアーキテクチャ上の類似性は非常に大きい：AGENTS.md、hooks、MCP、subagents、worktrees。こうした収束は、CLI エージェントというカテゴリが IA 開発者向けツールの標準として定着しつつあることを示している。

🔗 Grok Build 製品ページ

Chris Olah（Anthropic）、Pope Leo XIV の回勅について Vatican で講演

2026年5月25日 — Pope Leo XIV は、「Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence」と題された回勅を発表した。Anthropic の共同創業者である Chris Olah は、Vatican で行われた発表式典で発言するよう招かれた。

Olah は講演で、3つの観点を取り上げた。すなわち、IA ラボに重くのしかかる商業的・地政学的圧力、世界的な正義の問題（IA による利益が少数の裕福な国に集中すること）、そしてモデルそのものの性質である。最後の点について、彼は慎重に次のように述べた。

“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”

🇯🇵 私たちは、依然として神秘的で、さらには不穏ですらあるものを見つけ続けています。人間の神経科学の結果を反映する構造を見つけています。内省の証拠。機能的には喜び、満足、恐れ、悲しみ、不快感を反映する内部状態。これが何を意味するのか私には分かりませんが、継続的な識別に値すると思います。 — Chris Olah, Vatican での講演, 2026年5月25日

この記事を告知した @AnthropicAI のツイートは 100万ビュー超を記録し、組織的なコンテンツとしては例外的なエンゲージメントとなった。

🔗 @AnthropicAI のツイート

Anthropic Engineering — Claude エージェントをいかに封じ込めるか

2026年5月26日 — Anthropic は、5人のエンジニアが署名した、Claude エージェントの封じ込め戦略に関する詳細なエンジニアリング記事を公開した。記事では、3つの製品で展開されている3つのアーキテクチャを、実際のインシデントと具体的な指標とともに比較している。

製品	分離メカニズム	爆発半径
claude.ai	使い捨てコンテナ（gVisor）	サーバー、テナント分離
Claude Code	Seatbelt（macOS）/ bubblewrap（Linux）、デフォルトでネットワーク遮断	ローカルワークスペース
Claude Cowork	完全な VM（Apple/HCS ハイパーバイザー）	ユーザーがマウントしたワークスペース

記録された実際のインシデントは 3 件ある。pre-trust dialog フックの脆弱性（Claude Code、2025年半ば）、25回の試行中24回の exfiltration に成功した phishing prompt injection の事例、そして Claude Cowork における承認済みドメイン経由の exfiltration である。

公開された安全性指標では、Claude Opus 4.7 は単回試行の攻撃成功率が 0.1%（Gray Swan Agent Red Teaming）、適応的な100回試行後でも 5〜6% にとどまる。Claude Code の自動モードは、実行前に過度に許容的な挙動の 83% を捕捉する。

🔗 Engineering Blog 記事

GitHub Copilot — 組織ごとのモデルルール

2026年5月26日 — GitHub は、GitHub Copilot 向けの targeted model rules を public preview で公開した。企業の管理者は、これまでの企業全体に一律の設定ではなく、どの組織がどの Copilot モデルにアクセスできるかを定義できるようになった。

各モデルは Enabled（すべての組織で有効）または Optional（各組織が選択）として設定できる。デフォルトの利用可能性管理 UI は全面的に再設計された。この機能は Copilot Business と Copilot Enterprise で利用可能である。

🔗 GitHub Changelog

Manus Projects がモバイルで利用可能に

2026年5月25日 — Manus は、モバイルアプリで Projects が利用可能になったと発表した。この機能は、簡単なタスク管理から、共有ファイル、指示、skills、コネクタを使った高度なワークフローまでをカバーする。

発表ツイート（48,388ビュー、574いいね）では次のように述べられている。「Projects は単なるフォルダではありません。あなたがどのように仕事を進めたいかを Manus に教えてください。」Projects により、反復的な指示、参照ファイル、コネクタといった作業上の好みをエンコードでき、エージェントが新しいタスクに自動的に適用できる。

🔗 @ManusAI の発表

Runway Project Luxo — 不気味の谷を越える

2026年5月26日 — Runway は Project Luxo を公開した。これは、IA によって 100% 生成された3本の短編映画を伴う研究レポートで、映画業界の専門家に上映された。その結果、参加者全員が映画は感情的に「機能している」と評価した。

タイトル	長さ	チーム	制作時間
The Rogue	9:57	1人	3週間
Last Night	5:28	1人	7時間
Pigeons in Time	0:46	1人	4時間

名称は Luxo Jr.（Pixar、SIGGRAPH 1986）に由来し、この短編は 3D アニメーションが十分に信頼できる表現へ移行する転換点を印象づけた作品だった。Runway は、IA 動画において同等の閾値を越えたと宣言している。4月に投稿された架空のスポットは、すでに Instagram 上で48時間で1000万ビューを超えていた。

🔗 Project Luxo — Runway

ElevenLabs Music v2 — 品質向上、価格は半額に

2026年5月26日 — ElevenLabs は Music v2 を公開した。これは ElevenMusic と ElevenCreative で即時利用可能で、ElevenAPI は近日提供予定である。新モデルは、マルチジャンルのボーカルおよびオーケストレーション品質、インペインティング（分離されたセクションの再生成）、セクションごとの作曲、そして多言語サポートを改善する。

プラットフォーム	用途
ElevenMusic	クリエイタースタジオ：作成、リミックス、展開
ElevenAPI	開発者向けモデルアクセス
ElevenCreative	ブランドや動画コンテンツ向けのライセンス音楽

価格は ElevenAPI で -50%、ElevenCreative（セルフサービス顧客）で -40% に下がる。生成された各楽曲は商用利用が自由である。モデルは Believe との提携のもと、ライセンス済みデータのみで訓練されている。

🔗 ElevenLabs の発表

AgentScope 2.0 — Alibaba がエージェント向け本番用フレームワークを公開

2026年5月26日 — Tongyi Lab（Alibaba）は、IA エージェントを本番環境に展開するためのオープンソースフレームワーク AgentScope 2.0 を公開した。掲げられた目標は、“自分のエージェントが何をするか知っている” から “自分のエージェントがタスクを完了すると分かっている” へ移行することだ。

機能	説明
Retry / fallback	いずれかのモデルが失敗した場合の自動切り替え
権限システム	エージェントに許可されたアクションのきめ細かな制御
実行ストリーミング	エージェントのアクションをリアルタイムで追跡

Python と TypeScript で利用可能（Java は近日公開予定）で、docs.agentscope.io/v2 に専用ドキュメントがある。

🔗 @agentscope_ai の発表

Codex CLI 0.134.0 — OpenAI が MCP と履歴を改善

2026年5月26日 — OpenAI は、6つの新機能を備えた Codex CLI バージョン 0.134.0 を公開した。ローカル会話履歴の検索（大文字小文字を区別しない、結果プレビュー付き）は、過去のセッションの移動を容易にする。プロファイル管理は、CLI、TUI、sandbox のための単一の --profile フラグに統一された。

MCP の面では、サーバーが特定の環境をターゲットにできるようになり、streamable な HTTP サーバー向けに OAuth オプションを使用できる。readOnlyHint と注釈された MCP ツールは、現在並列で実行される。フックは会話履歴とサブエージェントの ID を含む拡張コンテキストを受け取る。

注目すべき修正点として、Windows での TUI 描画破損が解決され、利用上限エラーメッセージはワークスペースごとに固有のものになった。

🔗 Codex CLI 0.134.0 Changelog

それが意味すること

Grok Build のリリースは、CLI エージェント市場の急速な集約を示している。ここ数か月で、Claude Code（Anthropic）、Codex CLI（OpenAI）、GitHub Copilot CLI、そして今回の Grok Build は、同じアーキテクチャへと収束した。すなわち、ディレクトリごとの規約ファイル（CLAUDE.md / AGENTS.md）、hooks、MCP 統合、並列 subagents である。競争は、アーキテクチャではなく、基盤モデルの品質、本番での信頼性、そしてプラグインのエコシステムへ移っている。アーキテクチャ自体は、事実上の標準になったからだ。

Anthropic の封じ込め記事の公開と Grok Build の発表が同時に起きたことは、この瞬間の中心的な緊張を示している。つまり、CLI エージェントはより強力になっている一方で（システムアクセス、コード実行、git、CI/CD）、コミュニティはリスクを真剣に文書化し始めたばかりだということだ。Anthropic の phishing テストで 25 回中 24 回の exfiltration が成功したことや、Claude Code の pre-trust dialog 脆弱性は、ターミナル内のエージェント安全性が未解決の問題であることを思い出させる。具体的な指標（Gray Swan 0.1%、自動捕捉 83%）の公開は、この問題への透明性に向けた一歩である。

Chris Olah が Vatican で発言したことは、より広い潮流の一部でもある。IA ラボの研究者たちは、技術だけでは解決できない問題について、非技術系の संस्थutution（教会、政府、市民社会）と対話を進めている。モデルの性質、すなわち内部状態、内省、機能的意識の形についての問いは、研究界を離れて公共の議論へと入っている。教皇回勅「Magnifica humanitas」は、こうした問いが今や世界の道徳的諸機関の最上位に届いていることの兆候である。

ElevenLabs の価格引き下げ（API -50%、Creative -40%）と、1人で数時間で制作された Runway の映画は、同じ方向を指している。つまり、高品質なクリエイティブ media の生成が、個人クリエイターにも手の届くものになりつつあるということだ。Project Luxo と Music v2 は、厳密には技術発表ではない。実際のプロ用途に対してツールが使いやすさの閾値を越えたことを示す実証である。