Project Glasswing et Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

2026年4月5日から9日の週は、2つの大きな発表が話題をさらいました。Anthropicは、Claude Mythos Previewを中心に11の大手テック企業からなる連合Project Glasswingを発表し、大規模にゼロデイ脆弱性を検出する取り組みを示しました。一方Metaは、1年ぶりとなるopen-weightsではない最初のモデルであるMuse Sparkを発表して復帰しました。並行して、Google、OpenAI、GitHub、Perplexityもそれぞれ、開発者とユーザー向けの注目すべき更新を公開しました。

Project Glasswing et Claude Mythos Preview

2026年4月7日 — Anthropicは、Project Glasswingを発表しました。これは、Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、The Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksの11組織をまとめるソフトウェアセキュリティのイニシアチブです。この取り組みは、限定アクセスの新しいフロンティアモデルであるClaude Mythos Previewの能力を活用しています。

Ce que fait Mythos Preview

このモデルは、主要なオペレーティングシステムやWebブラウザに存在する数千件のゼロデイ脆弱性を特定する能力を実証しており、その中には数十年にわたって眠ったままになっていたものもありました。3つの具体例が、その発見の幅広さを示しています。

OpenBSDにある27年前の脆弱性で、接続された任意のマシンをリモートでクラッシュさせることができる
FFmpegにある16年前の脆弱性で、500万回以上テストされたコード行の中に隠れており、検出されなかった
Linuxカーネル内の複数の脆弱性で、マシンの完全制御に至る権限昇格を可能にする

これらの例は、Mythos Previewが表面的な検出をしているのではないことを示しています。つまり、何年ものあいだ数千人の研究者によって継続的に監査されてきた重要なコードベースの奥深くに埋もれた、ロジック上の誤りを見つけ出しているのです。

Benchmarks

ベンチマークにおけるMythos Previewの性能は、Opus 4.6と比べて明確な進歩を示しています。

ベンチマーク	Mythos Preview	Opus 4.6
SWE-bench Verified	93.9 %	80.8 %
SWE-bench Pro	77.8 %	53.4 %
Terminal-Bench 2.0	82.0 %	65.4 %
SWE-bench Multilingue	87.3 %	77.8 %
CyberGym (サイバーセキュリティ)	83.1 %	66.6 %
GPQA Diamond	94.6 %	91.3 %
Humanity’s Last Exam (sans outils)	56.8 %	40.0 %

SWE-bench Verifiedでの飛躍、80.8 %から93.9 %への上昇は、特に重要です。これは、実際のオープンソースリポジトリにある本物のバグを解決するモデルの能力を測るうえで最も広く使われているベンチマークだからです。サイバーセキュリティ向けのCyberGymでは、16ポイント超の上昇により、Mythos Previewは攻防両面のセキュリティタスクにおいて別格のカテゴリに位置づけられます。

Engagement financier et gouvernance

Anthropicは、プロジェクトのパートナーに対して1億ドル相当の利用クレジットを提供することに加え、オープンソースのセキュリティ組織への直接寄付として400万ドルを拠出します。

Linux Foundationを通じてAlpha-OmegaとOpenSSFに250万ドル
Apache Software Foundationに150万ドル

このレベルの資金的コミットメントは、AnthropicがGlasswingを単なる広報上の提携ではなく、長期的な取り組みとして位置づけていることを示しています。修正された脆弱性に関する報告書は、90日以内に公開されます。

Disponibilité et tarification

Mythos Previewは、現時点では一般公開されていません。最初のクレジット期間が終了すると、モデルは参加者向けに25 $/125$ per million de tokens（入力/出力）で利用可能になり、Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry経由でアクセスできます。

発見された脆弱性とエクスプロイトに関する詳細な技術レポートはAnthropicのRed Teamブログで公開されており、完全なsystem cardはanthropic.comに掲載されています。

“This project represents a watershed moment for AI-assisted cybersecurity — not because of what Claude can do today, but because of what it will be able to do as capabilities continue to scale.”

🇯🇵 このプロジェクトは、AI支援サイバーセキュリティにとって転換点となる瞬間です。――それは、Claudeが今日できることのためではなく、能力が進化し続けるにつれて、Claudeが何を実現できるようになるのかによるのです。 — Anthropic公式発表

🔗 Project Glasswing · System Card Mythos Preview · Rapport Red Team

Meta Muse Spark : retour de Meta avec un modèle fermé

2026年4月8日 — Metaは、Muse Sparkを発表しました。これは、**Meta Superintelligence Labs (MSL)**によって開発された新しい「Muse」ファミリーの最初のモデルで、先進AI研究に特化した新しい社内組織です。これは2025年4月のLlama 4以来のMetaのモデルであり、1年ぶりの沈黙からの復帰であると同時に、open-weightsで公開されない初のMetaモデルでもあります。

Capacités et positionnement

Muse Sparkは「個人的な超知能」(personal superintelligence)への一歩として位置づけられています。このモデルは、複数の分野にわたる高度な能力を備えています。

領域	説明
マルチモーダル	高度な視覚認識と理解、視覚情報の相互統合
推論	段階的推論、答える前に考える（test-time reasoning）
医療	医療画像の分析、個別化された食事提案
エージェント的	複雑なタスク向けのエージェント機能
Contemplating mode	複数のエージェントが並列に推論するオーケストレーション（段階的展開）

このモデルは、推論トークンを最適化するための「思考圧縮」(thought compression)を組み込み、複数の並列エージェントを通じたtest-time scalingをサポートします。まだ段階的に展開中のContemplatingモードは、最も注目されている機能の1つです。同じ問題に対して複数のエージェントを並列に割り当て、それぞれが独立して推論したうえで統合できます。

Performances

Artificial Analysis（2026年4月8日）によると、Muse SparkはArtificial Analysis Intelligence Indexで52を記録し、Gemini 3.1 Pro、GPT-5.4、Claude Opus 4.6に次ぐ世界トップ4に位置します。Metaにとって印象的な復帰であり、最上位のフロンティアモデルの列に直接戻ってきました。

Architecture

Metaは、Muse Sparkのために3つのスケーリング軸を示しています。

事前学習：アーキテクチャとデータの改善を伴う、9か月にわたるスタック全体の全面刷新
強化学習 (Reinforcement Learning)：事前学習後の能力をスケーラブルに増幅
Test-time reasoning：エージェントの並列化により、レイテンシを増やさずに拡張推論を実現

Sécurité et disponibilité

Metaは、自社のAdvanced AI Scaling Framework v2を通じて包括的な評価を実施したと述べています。Apollo Researchは、リリース前のチェックポイントに対して第三者評価を行い、高リスク領域（生物学など）で堅牢な拒否挙動を確認しました。

Muse Sparkは、4月8日からmeta.aiおよびMeta AIアプリで利用できます。APIアクセスは選定パートナー向けのプライベートプレビューであり、現時点では一般公開されていません。

🔗 Blog Meta AI — Muse Spark · Tweet annonce · Benchmark Artificial Analysis

Anthropic : infrastructure et agents

Partenariat Google + Broadcom — plusieurs gigawatts de TPU dès 2027

2026年4月6日 — Anthropicは、GoogleおよびBroadcomと、2027年以降に稼働開始予定の次世代TPU計算能力数ギガワット規模に関する契約を発表しました。これはAnthropic史上最大のインフラ投資です。

成長の背景は大きいものがあります。

年率換算売上 (run-rate revenue) は、2025年末の約90億ドルから、現在は300億ドル超に達している
1,000社超の法人顧客がそれぞれ年間100万ドル超を支出しており、2026年2月の500社超から増加している — 2か月足らずで倍増

“This groundbreaking partnership with Google and Broadcom is a continuation of our disciplined approach to scaling infrastructure: we are building the capacity necessary to serve the exponential growth we have seen in our customer base while also enabling Claude to define the frontier of AI development.”

🇯🇵 GoogleおよびBroadcomとのこの提携は、インフラの大規模拡張に対する私たちの厳格なアプローチに沿ったものです。私たちは、顧客基盤の指数関数的な成長に対応するために必要な能力を構築すると同時に、ClaudeがAI開発の最前線を定義できるようにしています。 — AnthropicのCFO、Krishna Rao

新たな計算資源の大半は米国に設置される予定で、2025年11月に発表された米国インフラへ500億ドルを投資するというコミットメントが継続されています。Claudeは、AWS Bedrock、Google Cloud Vertex AI、Microsoft Azure Foundryという3大クラウドプラットフォームで利用できる唯一のフロンティアモデルです。

🔗 Annonce partenariat

Managed Agents — architecture découplée, latence réduite de 90 %

2026年4月8日 — AnthropicのEngineering Blogは、Claudeプラットフォーム上で長時間稼働するエージェントを実行するホステッドサービスManaged Agentsのアーキテクチャを詳述する技術記事を公開しました。

中心的な考え方は、脳（Claudeとそのharness）を手（実行サンドボックス、ツール）およびセッション（イベントログ）から切り離すことです。各コンポーネントは、独立して、交換可能で、個別にスケーラブルなインターフェースになります。

分離によって得られた測定結果。

指標	改善
p50 TTFT (最初のトークンまでの時間)	-60 %
p95 TTFT	-90 %

この分離は、2つのセキュリティ問題も解決します。認証情報の分離（OAuthトークンはコード実行サンドボックスから決してアクセスできない）と耐障害性（harnessが停止しても、新しいインスタンスが最後のセッションイベントからコンテキストを失わずに再起動する）です。

🔗 Scaling Managed Agents

Google Gemini

Gemini CLI v0.37.0 — Sandbox dynamique, Chapters et Browser persistant

2026年4月8日 — Gemini CLIのv0.37.0は、開発ワークフロー向けに3つの進化を導入します。

機能	説明
Dynamic Sandbox Expansion	サンドボックスの動的拡張 + LinuxとWindows向けのworktreeサポート
Chapters (Narrative Flow)	セッション構造を改善するため、ツールを「章」にテーマ別に整理
Advanced Browser Capabilities	永続的なブラウザセッションとbrowser agent内でのツールの動的検出

Chapters機能は、長いセッションに物語的な連続性をもたらします。各アクションの समूहはそれぞれ独自のロジックを持つ「章」を形成し、複雑なセッションの追跡と再開を容易にします。browser agentは永続性を獲得し、セッションは呼び出し間でも維持され、利用可能なツールは動的に検出されます。

🔗 Gemini CLI Changelog

Simulations interactives et modèles 3D dans Gemini App

2026年4月9日 — Gemini Appは、複雑な概念をチャット内で直接、インタラクティブなビジュアライゼーションへ変換できるようになりました。ユーザーは物理パラメータ（速度、重力、質量）をリアルタイムで調整し、その影響を機能するシミュレーション—月の軌道、分子の回転、動的システム—で確認できます。Proモデルをプロンプトバーで使えば、世界中で利用可能です。EducationおよびWorkspaceアカウントでは現時点で利用できません。

🔗 Simulations 3D dans Gemini App

Notebooks Gemini — synchronisation avec NotebookLM

2026年4月8日 — GoogleはGemini AppにNotebooksを導入しました。これは、複雑なプロジェクト向けにGemini AppとNotebookLMを同期する永続的なワークスペースです。ノートブックでは、会話、カスタム指示、ファイル（文書、PDF）を整理できます。Gemini Appに追加されたソースはNotebookLMに自動的に表示され、その逆も同様です。Web版は今週、Google AI Ultra、Pro、Plusの加入者向けに利用可能になります。モバイル版と無料アクセスは今後提供予定です。

🔗 Notebooks Gemini + NotebookLM

OpenAI

Nouveau palier Pro à 100 $/mois — 5x plus de Codex

2026年4月9日 — OpenAIは、**100 $/mois**の新しいPro段階を導入しました。これは、Plus段階（約20$ /mois）と既存の200 $/moisのProの中間に位置します。より長く集中的なセッション向けに設計されており、Plusの5倍のCodex使用量を提供します。

段階	価格	Codex使用量
Plus	~20 $/mois	標準
Pro (新規)	100 $/mois	5× Plus
Pro (既存)	200 $/mois	最大

並行して、OpenAIは既存の200 $/mois加入者向けの2倍Codex使用プロモーションを2026年5月31日まで延長し、レート制限をリセットします。

“Next phase of enterprise AI” — note de Denise Dresser

2026年4月8日 — 最高収益責任者（Chief Revenue Officer）のDenise Dresserが、就任後90日を経て概要を公開しました。主なポイントは、enterprise事業が現在売上の40 %超を占め（2026年末には一般向けと同等に向かう軌道）、Codexの週間ユーザー数が300万人超（2026年初頭から5倍超）、そしてChatGPTの週間ユーザー数が9億人であることです。OpenAIは2つの戦略軸を提示しています。OpenAI Frontier（企業システムを横断するエージェント）と、チーム向けの統合されたAIスーパアプリです。

🔗 Next phase of enterprise AI

Safety Fellowship と Child Safety Blueprint

2026年4月6-8日 — OpenAI は2つの安全性 инициативを発表します。OpenAI Safety Fellowship（4月6日）は、2026年5月3日まで応募可能な外部研究プログラムで、評価、堅牢性、エージェント的な監督に関する研究向けに、報酬と計算リソースが提供されます。日程は 2026年9月14日から2027年2月5日です。Child Safety Blueprint（4月8日）は、NCMEC、Thorn、Attorney General Alliance と共同で策定された、AIによる児童搾取への対策フレームワークを提案します。内容は3本柱で構成されており、AI生成CSAMコンテンツに関する法整備の近代化、通報の改善、そして安全性を設計段階から組み込むこと（safety-by-design）です。

🔗 Safety Fellowship · Child Safety Blueprint

GitHub Copilot

ターミナルから OWASP Top 10 セキュリティスキャン

2026年4月9日 — GitHub Copilot CLI は、ターミナルから直接実行できる自動化されたセキュリティワークフローを統合しました。数コマンドで、開発者はリポジトリ全体の完全スキャンを実行し、結果を OWASP Top 10 カテゴリにマッピングし、検出された各脆弱性ごとに GitHub issue を自動で作成できます。CLI 環境を離れる必要はありません。すでに GitHub のツールチェーンを使っているチームにとっては、Project Glasswing の直接的な補完です。

“Rubber Duck” エージェント — 自動レビュー

2026年4月8日 — GitHub Research チームは、Copilot CLI 向けの “Rubber Duck” エージェントを公開しました。古典的なデバッグ手法（問題を見つけるためにコードを声に出して説明する）に着想を得て、このエージェントは送信されたコードを自動的に解析し、構造化されたレビューをそのままターミナルに出力します。実験的ではあるものの、@github によって正式に再投稿されています。

🔗 Copilot CLI OWASP のツイート · Rubber Duck のツイート

Perplexity

Plaid 統合 — Perplexity Computer 内の個人金融

2026年4月9日 — Perplexity は Plaid との統合を開始し、ユーザーが自分の銀行口座、クレジットカード、ローンを Perplexity Computer 内で直接連携できるようにしました。アクセスは 読み取り専用 で、データは Perplexity のサーバーを通過しません。Plaid のネットワークは 12,000 以上の金融機関（Chase、Fidelity、Vanguard、Robinhood など）をカバーしています。用途例: 純資産の計算、予算管理、債務返済プランナー、退職時の資産予測。米国とカナダ のデスクトップで利用可能です。

Tier	機能
Standard	ポートフォリオの連携、基本的な Portfolio アクセス
Pro / Max	高度な分析、インタラクティブなダッシュボード

Billion Dollar Build — スタートアップ競技

2026年4月8日 — Perplexity は “Billion Dollar Build” を開始しました。これは8週間のコンペティションで、チームが Perplexity Computer を使って、1億ドルの評価額への道筋を持つ企業を構築します。ファイナリストへの報酬は、Perplexity Fund から最大 100万ドル の投資と、Computer クレジット最大 100万ドル です。

🔗 Plaid 統合ブログ · Billion Dollar Build のツイート

エージェントとツール

Manus が Slack に統合 — 3つのモード

2026年4月6日 — Meta に提携された Manus は、3つのモードを中心とした Slack 統合の包括的なスイートを発表しました。DM 内のエージェント は個人タスク向けに永続メモリを持ち、チームのチャンネル内での @manus メンション は共同作業タスク向け（永続メモリなし。各スレッドは新しいタスク）で、MCP コネクタ は manus.im からあなたに代わってレポートや要約を自動化します。Slack の有料プランで利用可能です。

🔗 Manus for Slack ブログ

Genspark AI Workspace 4.0 — Claw Desktop、Office プラグイン

2026年4月8日 — Genspark は、4つのコンポーネントを備えた AI ワークスペースの 4.0 版を発表しました。Claw for Desktop（Computer Use と Browser Use によるコンピュータ制御）、PowerPoint、Excel、Word 向けの Microsoft Office プラグイン、Speakly（リアルタイム翻訳と会議メモ取り）、そして新しい OpenCode エンジン上の Advanced Workflows です。

🔗 Genspark ブログ

生成メディアとハードウェア

Stability AI Brand Studio — ブランド向けクリエイティブプラットフォーム

2026年4月8日 — Stability AI は、企業のマーケティングチーム向けに設計された包括的なクリエイティブ制作プラットフォーム Brand Studio を発表しました。システムの中核は Brand Central Hub で、ブランドの視覚要素（写真スタイル、配色、パターン、ロゴ配置）をもとに学習した Brand ID モデルにあります。Producer Mode は、説明文を構造化された制作計画に変換し、それを段階的に自動実行します。Curated Model Routing は、Stability AI およびサードパーティの提供モデル（Seedream や Nano Banana を含む）の中から、最適なモデルを賢く選択します。企業向け機能として、SSO、ロールベースのアクセス制御、承認ワークフローがあります。ローンチパートナーはクリエイティブエージェンシー Huge。提供形態は Core プラン（無料トライアル） + Enterprise プランです。

🔗 Stability AI による Brand Studio

NVIDIA — 全国ロボティクス週間

2026年4月9日 — 全国ロボティクス週間に合わせて、NVIDIA は Physical AI 技術に関するリソース記事を公開しました。NVIDIA Cosmos（世界基盤モデル）、Isaac Sim（シミュレーション）、Jetson シリーズ（edge AI）、Nemotron および NemoClaw（オープンソース）を紹介しています。新しいハードウェア発表はなく、開発者向けに NVIDIA のロボティクス・エコシステムをわかりやすく整理した内容です。

🔗 NVIDIA Robotics Week

Claude Code — v2.1.94 / v2.1.96 / v2.1.97 の更新

今週、3つの新バージョンがリリースされました。

バージョン	日付	主なポイント
v2.1.94	4月5-6日	Mantle 搭載の Bedrock サポート、API-key/Bedrock/Enterprise 向けのデフォルト `high` effort、Slack MCP リンクのコンパクト表示
v2.1.96	4月7日	Bedrock のリグレッション修正: `403 "Authorization header is missing"` で `AWS_BEARER_TOKEN_BEDROCK` エラー
v2.1.97	4月8-9日	NO_FLICKER モードでの `Ctrl+O` フォーカスビュー切り替え、ステータス行の `refreshInterval` パラメータ、`● N running` 内の `/agents` インジケーター、Cedar の構文ハイライト

v2.1.94 では、注目すべき動作変更も導入されました。"skills": ["./"] 経由で宣言された skills プラグインは、ディレクトリ名ではなく frontmatter の name フィールドを使用するようになりました。v2.1.97 では、Bash の複数の権限問題（環境変数の prefix、ネットワーク redirections）と、名前が JavaScript の prototype プロパティ（toString など）に一致する権限ルールが settings.json で静かに無視されるバグが修正されています。

🔗 Claude Code CHANGELOG

それが意味すること

2026年4月5日から9日の週は、交差する2つの方向で加速が起きたことを示しています。ひとつは、Anthropic が一般消費者向けプロダクトのロジックから離れ、クリティカルなインフラのロジックへ移行しつつあることです。Project Glasswing と Google/Broadcom の提携は、Anthropic がベンチマーク競争の単なるライバルではなく、グローバルなテック・エコシステム全体に対する AI 能力の供給者として位置づけられていることを示しています。100億ドルのクレジットと 300億ドルの年換算売上のコミットメントが、この見方を補強しています。

もうひとつは、Meta が open-weights 政策を破って Muse Spark で復帰したことです。これは大きな戦略転換です。Meta は open source の立場を維持するのではなく、閉じた frontier セグメントで競争する道を選びました。Meta Superintelligence Labs の設立と、Llama ではない初のモデルは、同社の AI 戦略が深く再編されていることを示しています。

開発者にとって、この週は濃密でありながら一貫しています。Gemini CLI は永続性と構造化を強化し、GitHub Copilot はセキュリティ範囲を拡張し、Perplexity は個人データへ踏み込み、Claude Code は高速な更新サイクルを継続しています。

ソース

この文書は、gpt-5.4-mini モデルを使用して fr 版から ja 言語へ翻訳されました。翻訳プロセスの詳細については、https://github.com/jls42/ai-powered-markdown-translator をご覧ください。