ai-powered-markdown-translatorgpt-5.4-miniでfrからjaに翻訳された記事。
2026年5月25日と26日は、xAI が Grok Build(40.8百万ビュー)で CLI エージェント市場に鮮烈に参入した一方で、Anthropic はエージェントの安全性に関するエンジニアリング記事を公開し、共同創業者が Vatican で発言するという出来事が起きた。並行して、ElevenLabs は Music v2 を半額の価格でリリースし、Runway は動画 IA においていわゆる「不気味の谷」を自社いわく越え、OpenAI と Alibaba もそれぞれエージェントツールの注目すべき更新を公開した。
Grok Build — xAI がターミナル用コードエージェントを発表
2026年5月25日 — xAI は、ターミナルから直接動作するコーディングエージェント(coding agent)である Grok Build のベータ版を発表した。この発表は、数時間で X 上で 40.8百万ビューを記録し、ここ数か月で xAI の投稿の中でも最も拡散したものの一つとなった。
Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.
🇯🇵 Grok Build は現在、すべての SuperGrok および X Premium+ ユーザー向けにベータ版として利用できます。Plan Mode を使い、Imagine で画像や動画を作成し、CLI を使って自動化やオーケストレーターを構築してください。開始するには x.ai/cli にアクセスしてください。 — @xai on X
ツールは 1 コマンドでインストールできる: curl -fsSL https://x.ai/cli/install.sh | bash
SuperGrok および X Premium+ の加入者は、追加のサブスクリプション料金なしで即座に利用できる。
主な機能
| 機能 | 説明 |
|---|---|
| Plan Mode | 変更前の構造化された計画 — 各変更は明示的な承認があるまでブロックされる |
| Skills | 再利用可能なワークフロー(AGENTS.md、プラグイン、フック、MCP)で、名前または自動で呼び出し可能 — 作成には /skillify |
| Subagents | 検索、構築、レビューのために並列実行される専門エージェント |
| Plugins | 共有マーケットプレイス:Linear、Sentry、Postgres、MCP 経由のブラウザ |
| Git integration | ターミナルから stage、commit、push、ブランチ管理 |
| Code review | PR を開く前の行単位フィードバック |
| Memory | セッション間での意思決定の永続化 |
| Headless mode | CI/CD パイプラインで利用可能 |
Claude Code とのアーキテクチャ上の類似性は非常に大きい:AGENTS.md、hooks、MCP、subagents、worktrees。こうした収束は、CLI エージェントというカテゴリが IA 開発者向けツールの標準として定着しつつあることを示している。
Chris Olah(Anthropic)、Pope Leo XIV の回勅について Vatican で講演
2026年5月25日 — Pope Leo XIV は、「Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence」と題された回勅を発表した。Anthropic の共同創業者である Chris Olah は、Vatican で行われた発表式典で発言するよう招かれた。
Olah は講演で、3つの観点を取り上げた。すなわち、IA ラボに重くのしかかる商業的・地政学的圧力、世界的な正義の問題(IA による利益が少数の裕福な国に集中すること)、そしてモデルそのものの性質である。最後の点について、彼は慎重に次のように述べた。
“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”
🇯🇵 私たちは、依然として神秘的で、さらには不穏ですらあるものを見つけ続けています。人間の神経科学の結果を反映する構造を見つけています。内省の証拠。機能的には喜び、満足、恐れ、悲しみ、不快感を反映する内部状態。これが何を意味するのか私には分かりませんが、継続的な識別に値すると思います。 — Chris Olah, Vatican での講演, 2026年5月25日
この記事を告知した @AnthropicAI のツイートは 100万ビュー超を記録し、組織的なコンテンツとしては例外的なエンゲージメントとなった。
Anthropic Engineering — Claude エージェントをいかに封じ込めるか
2026年5月26日 — Anthropic は、5人のエンジニアが署名した、Claude エージェントの封じ込め戦略に関する詳細なエンジニアリング記事を公開した。記事では、3つの製品で展開されている3つのアーキテクチャを、実際のインシデントと具体的な指標とともに比較している。
| 製品 | 分離メカニズム | 爆発半径 |
|---|---|---|
| claude.ai | 使い捨てコンテナ(gVisor) | サーバー、テナント分離 |
| Claude Code | Seatbelt(macOS)/ bubblewrap(Linux)、デフォルトでネットワーク遮断 | ローカルワークスペース |
| Claude Cowork | 完全な VM(Apple/HCS ハイパーバイザー) | ユーザーがマウントしたワークスペース |
記録された実際のインシデントは 3 件ある。pre-trust dialog フックの脆弱性(Claude Code、2025年半ば)、25回の試行中24回の exfiltration に成功した phishing prompt injection の事例、そして Claude Cowork における承認済みドメイン経由の exfiltration である。
公開された安全性指標では、Claude Opus 4.7 は単回試行の攻撃成功率が 0.1%(Gray Swan Agent Red Teaming)、適応的な100回試行後でも 5〜6% にとどまる。Claude Code の自動モードは、実行前に過度に許容的な挙動の 83% を捕捉する。
GitHub Copilot — 組織ごとのモデルルール
2026年5月26日 — GitHub は、GitHub Copilot 向けの targeted model rules を public preview で公開した。企業の管理者は、これまでの企業全体に一律の設定ではなく、どの組織がどの Copilot モデルにアクセスできるかを定義できるようになった。
各モデルは Enabled(すべての組織で有効)または Optional(各組織が選択)として設定できる。デフォルトの利用可能性管理 UI は全面的に再設計された。この機能は Copilot Business と Copilot Enterprise で利用可能である。
Manus Projects がモバイルで利用可能に
2026年5月25日 — Manus は、モバイルアプリで Projects が利用可能になったと発表した。この機能は、簡単なタスク管理から、共有ファイル、指示、skills、コネクタを使った高度なワークフローまでをカバーする。
発表ツイート(48,388ビュー、574いいね)では次のように述べられている。「Projects は単なるフォルダではありません。あなたがどのように仕事を進めたいかを Manus に教えてください。」Projects により、反復的な指示、参照ファイル、コネクタといった作業上の好みをエンコードでき、エージェントが新しいタスクに自動的に適用できる。
Runway Project Luxo — 不気味の谷を越える
2026年5月26日 — Runway は Project Luxo を公開した。これは、IA によって 100% 生成された3本の短編映画を伴う研究レポートで、映画業界の専門家に上映された。その結果、参加者全員が映画は感情的に「機能している」と評価した。
| タイトル | 長さ | チーム | 制作時間 |
|---|---|---|---|
| The Rogue | 9:57 | 1人 | 3週間 |
| Last Night | 5:28 | 1人 | 7時間 |
| Pigeons in Time | 0:46 | 1人 | 4時間 |
名称は Luxo Jr.(Pixar、SIGGRAPH 1986)に由来し、この短編は 3D アニメーションが十分に信頼できる表現へ移行する転換点を印象づけた作品だった。Runway は、IA 動画において同等の閾値を越えたと宣言している。4月に投稿された架空のスポットは、すでに Instagram 上で48時間で1000万ビューを超えていた。
ElevenLabs Music v2 — 品質向上、価格は半額に
2026年5月26日 — ElevenLabs は Music v2 を公開した。これは ElevenMusic と ElevenCreative で即時利用可能で、ElevenAPI は近日提供予定である。新モデルは、マルチジャンルのボーカルおよびオーケストレーション品質、インペインティング(分離されたセクションの再生成)、セクションごとの作曲、そして多言語サポートを改善する。
| プラットフォーム | 用途 |
|---|---|
| ElevenMusic | クリエイタースタジオ:作成、リミックス、展開 |
| ElevenAPI | 開発者向けモデルアクセス |
| ElevenCreative | ブランドや動画コンテンツ向けのライセンス音楽 |
価格は ElevenAPI で -50%、ElevenCreative(セルフサービス顧客)で -40% に下がる。生成された各楽曲は商用利用が自由である。モデルは Believe との提携のもと、ライセンス済みデータのみで訓練されている。
AgentScope 2.0 — Alibaba がエージェント向け本番用フレームワークを公開
2026年5月26日 — Tongyi Lab(Alibaba)は、IA エージェントを本番環境に展開するためのオープンソースフレームワーク AgentScope 2.0 を公開した。掲げられた目標は、“自分のエージェントが何をするか知っている” から “自分のエージェントがタスクを完了すると分かっている” へ移行することだ。
| 機能 | 説明 |
|---|---|
| Retry / fallback | いずれかのモデルが失敗した場合の自動切り替え |
| 権限システム | エージェントに許可されたアクションのきめ細かな制御 |
| 実行ストリーミング | エージェントのアクションをリアルタイムで追跡 |
Python と TypeScript で利用可能(Java は近日公開予定)で、docs.agentscope.io/v2 に専用ドキュメントがある。
Codex CLI 0.134.0 — OpenAI が MCP と履歴を改善
2026年5月26日 — OpenAI は、6つの新機能を備えた Codex CLI バージョン 0.134.0 を公開した。ローカル会話履歴の検索(大文字小文字を区別しない、結果プレビュー付き)は、過去のセッションの移動を容易にする。プロファイル管理は、CLI、TUI、sandbox のための単一の --profile フラグに統一された。
MCP の面では、サーバーが特定の環境をターゲットにできるようになり、streamable な HTTP サーバー向けに OAuth オプションを使用できる。readOnlyHint と注釈された MCP ツールは、現在並列で実行される。フックは会話履歴とサブエージェントの ID を含む拡張コンテキストを受け取る。
注目すべき修正点として、Windows での TUI 描画破損が解決され、利用上限エラーメッセージはワークスペースごとに固有のものになった。
それが意味すること
Grok Build のリリースは、CLI エージェント市場の急速な集約を示している。ここ数か月で、Claude Code(Anthropic)、Codex CLI(OpenAI)、GitHub Copilot CLI、そして今回の Grok Build は、同じアーキテクチャへと収束した。すなわち、ディレクトリごとの規約ファイル(CLAUDE.md / AGENTS.md)、hooks、MCP 統合、並列 subagents である。競争は、アーキテクチャではなく、基盤モデルの品質、本番での信頼性、そしてプラグインのエコシステムへ移っている。アーキテクチャ自体は、事実上の標準になったからだ。
Anthropic の封じ込め記事の公開と Grok Build の発表が同時に起きたことは、この瞬間の中心的な緊張を示している。つまり、CLI エージェントはより強力になっている一方で(システムアクセス、コード実行、git、CI/CD)、コミュニティはリスクを真剣に文書化し始めたばかりだということだ。Anthropic の phishing テストで 25 回中 24 回の exfiltration が成功したことや、Claude Code の pre-trust dialog 脆弱性は、ターミナル内のエージェント安全性が未解決の問題であることを思い出させる。具体的な指標(Gray Swan 0.1%、自動捕捉 83%)の公開は、この問題への透明性に向けた一歩である。
Chris Olah が Vatican で発言したことは、より広い潮流の一部でもある。IA ラボの研究者たちは、技術だけでは解決できない問題について、非技術系の संस्थutution(教会、政府、市民社会)と対話を進めている。モデルの性質、すなわち内部状態、内省、機能的意識の形についての問いは、研究界を離れて公共の議論へと入っている。教皇回勅「Magnifica humanitas」は、こうした問いが今や世界の道徳的諸機関の最上位に届いていることの兆候である。
ElevenLabs の価格引き下げ(API -50%、Creative -40%)と、1人で数時間で制作された Runway の映画は、同じ方向を指している。つまり、高品質なクリエイティブ media の生成が、個人クリエイターにも手の届くものになりつつあるということだ。Project Luxo と Music v2 は、厳密には技術発表ではない。実際のプロ用途に対してツールが使いやすさの閾値を越えたことを示す実証である。
ソース
- Grok Build の発表 — @xai
- Grok Build 製品ページ
- Chris Olah の Vatican での講演 — Anthropic
- @AnthropicAI のツイート — Olah Vatican
- Engineering Blog — Claude をどう封じ込めるか
- @AnthropicAI のツイート — Engineering Containment
- GitHub Changelog — Copilot model rules
- Manus Projects モバイル発表 — @ManusAI
- Project Luxo — Runway
- Music v2 — ElevenLabs
- AgentScope 2.0 — @agentscope_ai
- Codex CLI 0.134.0 — GitHub release