GPT-5.5 Instant による新しい ChatGPT のデフォルト、xAI API 上の Grok 4.3、Anthropic × Blackstone の enterprise

今週は盛りだくさんだった。OpenAI は GPT-5.3 の直接後継として GPT-5.5 Instant を ChatGPT の全ユーザー向けに提供し、xAI は 100 万トークンのコンテキストを備えた Grok 4.3 を API 上で公開、そして Anthropic は Blackstone、Hellman & Friedman、Goldman Sachs と共同で新しい enterprise 向け AI サービス会社の設立を発表した。ツール面では、GitHub が MCP サーバー経由のセキュリティ GA/プレビューを 3 倍に拡充し、Perplexity は財務チーム向け専用製品を投入、Runway は 1 枚の画像から生成するリアルタイム動画エージェントを発表した。

GPT-5.5 Instant — ChatGPT の新しいデフォルトモデル

5月5日 — OpenAI は、ChatGPT の全ユーザー向けに GPT-5.3 Instant を GPT-5.5 Instant に置き換え、デフォルトモデルとした。展開は 2 日間にわたって行われる。

次元	GPT-5.3 Instant に対する改善
幻覚（医療、法務、金融）	-52.5 %
不正確な主張（ユーザー報告）	-37.3 %
応答の冗長さ	平均文字数 -30.2 %

このモデルは画像解析、STEM の応答、Web 検索を使うかどうかの判断も改善している。応答は本質を損なわずにより簡潔になり、不要なフォーマットや無意味なフォローアップ質問も減っている。

メモリソース — OpenAI はすべての ChatGPT モデルに “memory sources” を導入した。保存済みの記憶、過去の会話、接続された Gmail から応答をパーソナライズした場合、ユーザーはどのソースが使われたかを正確に確認でき、修正や削除も可能になる。過去の会話やファイルを用いたパーソナライズは、まず Plus と Pro の加入者（Web）向けに提供され、他のプランは順次対応する。

提供状況：

すべての ChatGPT ユーザーに対して 2 日間かけて段階的に展開
API では chat-latest のエイリアスで利用可能
GPT-5.3 Instant は有料加入者向けに 3 か月間引き続き利用可能

🔗 GPT-5.5 Instant 公式発表

xAI API で Grok 4.3 を公開 — 100 万トークン、#1 agentic tool calling

5月5日 — xAI は X を通じて、xAI API（console.x.ai）で Grok 4.3 を公開したと発表した。このモデルは、これまでで最速かつ最も賢い同社のモデルとして紹介されている。

特性	値
コンテキストウィンドウ	100万トークン
agentic tool calling ベンチマーク	#1 (@ArtificialAnlys leaderboard)
instruction following ベンチマーク	#1 (@ArtificialAnlys leaderboard)
enterprise 分野	#1 case law と corporate finance (@ValsAI)
提供状況	xAI API（console.x.ai）— grok.com ではまだ未対応

Grok 4.3 is now live on the xAI API. It’s our fastest, most intelligent model to date. It tops the @ArtificialAnlys leaderboards in agentic tool calling and instruction following, and ranks #1 in @ValsAI enterprise domains like case law and corporate finance. Grok 4.3 supports a 1 million token context.

🇯🇵 Grok 4.3 が、xAI API でご利用いただけるようになりました。これは、現時点で最速かつ最も賢い私たちのモデルです。agentic tool calling と instruction following では @ArtificialAnlys のランキングで首位に立ち、企業法務やコーポレート・ファイナンスといった enterprise 分野では @ValsAI で #1 にランクされています。Grok 4.3 は 100 万トークンのコンテキストをサポートします。 — @xai sur X

このツイートは 2,570 万回の閲覧と 6,029 件のいいねを獲得した。注目点として、発表時点で x.ai/news に専用ページはなく、公開は X のみを通じて行われた。

Anthropic と Blackstone、Hellman & Friedman、Goldman Sachs — enterprise 向け AI サービスの新会社

5月4日 — Anthropic、Blackstone、Hellman & Friedman、Goldman Sachs は、追加のオルタナティブ系投資家コンソーシアムの支援を受ける新しい enterprise 向け AI サービス会社の設立を発表した。

目的は、大企業の中核業務に Claude を導入し、高度なエンジニアリングと深い業界知識を要する業務を支えることだ。Anthropic によれば、Claude に対する enterprise 需要は、単一の提供モデルでは吸収しきれない水準に達している。

典型的な運用モデルは、まず小規模なチームが顧客と密接に連携して摩擦点を特定し、その後、業務に合わせた Claude エージェントを構築するというものだ。具体例として示されたのは、複数拠点を持つ医療機関ネットワークで、Claude が診療記録の作成、定型的な事務作業、診療科間の連携を担い、臨床スタッフが患者ケアに集中できるようにするケースである。

この新会社は、Accenture、Deloitte、PwC に並んで Claude Partner Network に加わる。これは Anthropic の enterprise 流通戦略における構造的な一歩であり、API ライセンスを売るだけでなく、トップクラスの金融パートナーとともに複雑な実運用展開に踏み込むことを意味する。

🔗 公式発表

金融サービスと保険向けの Claude エージェント

5月5日 — Anthropic は、金融サービスと保険向けに、すぐに使える 10 個のエージェントテンプレート（ready-to-run）を公開した。Claude Cowork または Claude Code のプラグインとして、あるいは Claude プラットフォーム上の自律型 Claude Managed Agents として利用できる。

調査と顧客カバレッジ：

エージェント	役割
Pitch builder	ターゲットリスト、比較対象、ピッチブック
Meeting preparer	顧客および相手先のブリーフ
Earnings reviewer	書き起こしの読解とモデル更新
Model builder	filing とデータからの財務モデル作成
Market researcher	業界動向の監視とニュース要約

金融と運用：

エージェント	役割
Valuation reviewer	バリュエーションの検証
General ledger reconciler	会計照合と NAV 計算
Month-end closer	月次締めと仕訳作成
Statement auditor	財務諸表レビュー
KYC screener	事業体書類の収集とコンプライアンス審査

Claude は Microsoft Excel、PowerPoint、Word、Outlook（順次対応）に対し、アドイン（add-ins）経由で統合されるようになった。Claude Cowork の Dispatch 機能により、どこからでもテキストまたは音声でタスクを割り当てられる。

新しいデータコネクタ： Dun & Bradstreet、Fiscal AI、Financial Modeling Prep、Guidepoint、IBISWorld、SS&C IntraLinks、Third Bridge、Verisk、および Moody’s の MCP（6,000 以上の事業体に関する格付けとデータ）。

挙げられている顧客には、Citadel、FIS、BNY、Carlyle、Mizuho、Travelers、Walleye Capital（従業員の 100% が Claude Code を使用）、Hg、Morningstar、FactSet が含まれる。これらのエージェントは、Vals AI Finance Agent ベンチマークで #1 の Claude Opus 4.7 に最適化されている。

🔗 公式発表

Perplexity Computer for Professional Finance

5月5日 — Perplexity は、プロ向け金融のための Computer を公開した。これは、買い手側・売り手側のアナリスト、ヘッジファンド、プライベートエクイティ向けに特化した Computer のバージョンである。

次元	値
含まれるワークフロー	35（10 セグメント）
統合済みデータプロバイダー	14（Quartr、Fiscal を含む）
プレミアム MCP コネクタ	Morningstar、PitchBook、Daloopa、Carbon Arc
利用可能なプラットフォーム	Microsoft Teams、Agent API
今後対応予定	Excel add-in
FinSearchComp T1 ベンチマーク	1位（精度、コスト、遅延）

ライセンス付きサブスクリプションを持つチームは、MCP コネクタ経由で自社の認証情報を接続し、Morningstar、PitchBook、Daloopa、Carbon Arc にアクセスできる。その他のユーザーは、14 のデータプロバイダーに支えられた統合済み金融ツールを利用できる。

すべての数値はそのソースにリンクされる。SEC 文書由来の値については、Computer が計算過程を示し、文書内の該当ページを指し示す。FinSearchComp T1 ベンチマーク（時間制約に敏感なデータ抽出）では、Perplexity は精度、正解 1 件あたりのコスト、遅延で首位となり、リアルタイムの株価、暗号資産価格、為替レートも含まれる。

🔗 Perplexity ブログ — Computer for Professional Finance

Runway Characters — 1 枚の画像からのリアルタイム動画エージェント

5月4日 — Runway は Characters を発表した。これは 1 枚の画像をリアルタイムの会話型動画エージェントに変換できる技術である。

指標	値
エンドツーエンドの遅延	1.75 秒
動画品質	24 fps HD
必要な画像ソース	1 枚のみ
コールドスタート	60 倍高速（GPU ピアツーピア）

1.75 秒の遅延は、ユーザーが話し終えてからキャラクターが最初に応答するまでの時間を指す。Runway は同時に 2 本のエンジニアリング記事を公開した。1 本目はリアルタイム動画エージェントのアーキテクチャを説明し、2 本目は GPU のピアツーピア（peer-to-peer）インフラがコールドスタート時間を 60 分の 1 に短縮する仕組みを解説している。

想定ユースケースには、会話エージェント、インタラクティブなリアルタイムキャラクター、アプリ向けの動画インターフェースが含まれる。この技術は、動画レンダリングのオフライン処理から同期的な対話への移行を示している。

🔗 Runway Characters 発表ツイート

GitHub MCP Server — セキュリティの 3 つの大きな進展

5月5日 — GitHub は、MCP サーバー向けに 3 つのセキュリティ更新を同日にまとめて公開した。

Secret scanning の GA

GitHub MCP Server 経由の secret scanning は一般提供（2026年3月からプレビュー終了）に移行した。GitHub Copilot CLI では /plugin install advanced-security@copilot-plugins でインストールし、VS Code ではプラグイン advanced-security が /secret-scanning コマンドを公開する。

項目	詳細
ステータス	GA（一般提供）
利用可能条件	GitHub Secret Protection が有効なリポジトリ
統合	Copilot CLI、VS Code、あらゆる MCP 互換 IDE

MCP ツールは既存の push protection のカスタマイズにも従うようになり、バイパス（bypass）動作はリポジトリまたは組織の設定と整合する。

🔗 Changelog — Secret scanning GA

Dependency scanning の公開プレビュー

MCP Server 経由の依存関係脆弱性検出は公開プレビューになった。システムは GitHub Advisory Database を参照し、影響を受けるパッケージ、深刻度、推奨修正版バージョンを含む構造化結果を返す。

項目	詳細
ステータス	公開プレビュー
利用可能条件	Dependabot alerts が有効なリポジトリ
CLI での有効化	`copilot --add-github-mcp-toolset dependabot`

🔗 Changelog — Dependency scanning

GitHub Advanced Security × Microsoft Defender for Cloud の GA

GitHub Advanced Security × Microsoft Defender for Cloud の統合も GA になった。これは、クラウド環境にデプロイされたコンテナイメージを GitHub のソースコードと相関させ、セキュリティビューにランタイムの文脈を追加する。

組織ビューで利用可能になった新しいフィルター：has:deployment、runtime-risk:internet-exposed、runtime-risk:sensitive-data。セキュリティキャンペーンは GitHub Copilot のコーディングエージェントに直接割り当てることができる。

🔗 Changelog — Code-to-cloud GA

Model Spec Midtraining (MSM) — エージェントの整合性ずれが 68% から 5% に低下

5月5日 — Anthropic の研究者たちが、事前学習と整合性向けファインチューニング（alignment fine-tuning, AFT）の間に挟む整合手法「Model Spec Midtraining」（MSM）を発表した。

原理は、モデルが規則に従うことを学ぶ前に、自身の Model Spec の内容について議論する合成文書コーパスで学習させるというものだ。狙いは、ある規則がなぜ存在するのかを理解することで、その適用の頑健性が高まるという点にある。

モデル	誤整合（AFT のみ）	MSM + AFT あり
Qwen2.5-32B	68 %	5 %
Qwen3-32B	54 %	7 %

MSM は AFT のデータ効率も大幅に高める。比較可能な性能を達成するのに必要な AFT データは 40〜60 分の 1 で済む。著者らはまた、細かなサブルールを増やすよりも、規則の背後にある動機を説明する方が分布外での一般化を改善することを示した。

🔗 MSM 論文 — alignment.anthropic.com

NotebookLM Mind Maps — パーソナライズ、整理、ナビゲーション

5月5日 — NotebookLM は、Mind Maps を 3 つの機能で同時に強化した。

機能	説明
パーソナライズ	ユーザー固有の指示でマップを導く
整理	Mind Map を即座にリネームして共有
ナビゲーション	ノード間を滑らかに移動

展開はすべてのユーザーに向けて段階的に進められている。この更新は、4月初旬から続く NotebookLM の迅速な改善の流れを完成させるものだ。4月24日のソース自動整理（5月5日に 100% 展開完了）、4月30日の Gemini モバイルアプリへの統合がそれにあたる。

🔗 NotebookLM のツイート

Genspark sb-git — AI エージェント向けに書き換えられた Git サーバー

5月5日 — Genspark は sb-git を公開した。これは AI エージェント向けにゼロから書き直された Git サーバーである。Git の完全なセマンティクス：バージョン管理、ブランチ、diff、blame、rollback、push。

項目	詳細
CLI	`gsk`（init、clone-url、cat、commit）
互換性	Claude Code、OpenClaw、あらゆる Git エージェント
ストレージ	1 GB（無料）、10 GB（Plus/Pro）
アカウント要否	いいえ — GitHub アカウントは不要
提供状況	即時（Web + モバイル）

GitHub アカウントも事前のリポジトリ設定も不要だ。インストール時の摩擦なしで、一般的な AI エージェント（Claude Code、OpenClaw）との互換性に重点が置かれている。

🔗 Genspark sb-git のツイート

NVIDIA + ServiceNow — Project Arc、長時間稼働の自律デスクトップエージェント

5月5日 — ServiceNow Knowledge 2026 カンファレンスで、Jensen Huang と Bill McDermott は、企業向け自律 AI エージェントをめぐる両社のパートナーシップ拡大を発表した。

ServiceNow は、知識労働者向けに設計された長時間稼働の自律デスクトップエージェント Project Arc を公開する。対象は開発者、IT チーム、管理者だ。このエージェントはガバナンスとセキュリティのために NVIDIA OpenShell（オープンソースのサンドボックス）を使用し、ServiceNow Action Fabric を通じて ServiceNow プラットフォームにネイティブ接続する。

指標	値
Blackwell 対 Hopper の効率	50× tokens/watt
100万トークンあたりのコスト削減	約35×
Nemotron 3 Super（オープンソース）	#1 EnterpriseOps-Gym (NOWAI-Bench)
自律的に解決されたチケット	90%（ServiceNow + Apriel/Nemotron）

🔗 NVIDIA Blog — ServiceNow

NVIDIA NemoClaw + OpenClaw — GitHub 上で React を超える永続オープンソースエージェント

4月30日 — OpenClaw（Peter Steinberger によって作成）は60日で GitHub スター数25万超えを達成し、React を上回ってプラットフォームで最もスターの多いプロジェクトになりました。NVIDIA は、この永続的な self-hosted AI エージェントプロジェクトを保護するためにコミュニティと協力しています。

NVIDIA は NemoClaw を発表します。これは、OpenClaw + NVIDIA OpenShell + Nemotron を組み合わせ、強化されたデフォルトのセキュリティ設定を備えた、1コマンドでインストール可能なリファレンス実装です。

指標	値
OpenClaw の GitHub スター数	250,000+（2026年3月）
成長	GitHub の #1 プロジェクトを60日で達成（React を上回る）
エージェント推論 vs reasoning AI の倍率	1,000×
NemoClaw のインストール	1 コマンド

🔗 NVIDIA Blog — OpenClaw/NemoClaw

Luma AI Uni-1.1 API — クリエイティブブリーフを推論する画像生成

5月5日 — Luma AI は Uni-1.1 API を発表しました。これは、トークンではなくクリエイティブブリーフを推論するよう設計された画像生成モデルです。プロンプトエンジニアリングを必要とする従来の API とは異なり、Uni-1.1 は各ビジュアル伝統の美的文脈を理解し、最初の試行から実用的な結果を出力します。

言及されたユースケース：ファッションツール、建築レンダリング、漫画パイプライン、映画的コンテンツ。ミドルウェアは不要です。API は lumalabs.ai/api で利用可能です。

🔗 Luma AI Uni-1.1 のツイート

ChatGPT Ads Manager のセルフサーブと CPC 入札

5月5日 — OpenAI は広告プログラムを2つの新機能で拡張します。セルフサーブツール（米国ベータ版の Ads Manager）と、CPC（クリック単価）入札モードの開始です。

モード	状態	説明
CPM（1,000 インプレッションあたりのコスト）	既存	プログラム開始時から利用可能
CPC（クリック単価）	新規	広告主は実際のクリック時のみ支払い
Ads Manager セルフサーブ（ベータ）	新規	米国の広告主が利用可能

代理店パートナー：Dentsu、Omnicom、Publicis、WPP。テクノロジーパートナー：Adobe、Criteo、Kargo、Pacvue、StackAdapt。OpenAI はまた、個々の会話を広告主に公開することなくクリック後のアクションを測定するための Conversions API とピクセルトラッキングも開始しました。

🔗 OpenAI 広告発表

Perplexity Premium Health Sources

5月5日 — Perplexity はプレミアム健康ソースを導入します。プラットフォーム上の10件以上に1件のリクエストが健康に関するものです。開始時に利用可能なソースは NEJM、BMJ Journals、BMJ Best Practice で、通常は संस्थागतサブスクリプションに限定される医療リファレンスです。

Computer では、これらのソースは手動選択なしで健康関連の質問に対して自動的に有効化されます。各回答には追跡可能な引用が含まれます。今後追加されるソース：Micromedex、EBSCOhost、Health Affairs、VisualDx、American Academy of Orthopaedic Surgeons、American Diabetes Association、Springer Publishing。

🔗 Perplexity Blog — Premium Health Sources

短報

Manus — コネクタの自動レコメンド — Manus は現在、タスクを完了するために必要なコネクタ（Slack、Notion、Gmail、Google Drive）を検出し、会話の流れを離れずに会話内で推奨します。アクティベーションは引き続きユーザーの確認が必要です。 🔗 source
Black Forest Labs — FLUX Creator Program — BFL は、今後の FLUX モデルへの早期アクセスを提供する選抜制のクリエイター向けプログラムを開始し、BFL のチャネルを通じて彼らの作品を拡散します。 🔗 source
GPT-5.5 Instant System Card — OpenAI の Preparedness Framework におけるサイバーセキュリティおよび生物学・化学カテゴリで「High capability」に分類された Instant 系列の最初の System Card です。これに応じて強化された保護措置が実装されました。 🔗 source
OpenAI — WebRTC relay+transceiver アーキテクチャ — OpenAI は、リアルタイム音声（ChatGPT Voice、Realtime API）向けに、900万人以上の週次ユーザーにサービスを提供する WebRTC インフラの再設計を説明するエンジニアリング記事を公開しました。アーキテクチャは、パケットルーティング（軽量でステートレスな relay）とプロトコル終端（ステートフルな transceiver）を分離し、公開 UDP フットプリントを抑えた標準的な Kubernetes デプロイを可能にします。 🔗 source

それが意味すること

企業向け AI の最優先プレイグラウンドとしての金融。 24時間の間に、Anthropic、Perplexity、xAI はそれぞれ金融チームを明確に対象とした発表を行いました。すなわち、評価、KYC、月次締めのための10個の Claude エージェントテンプレート、35ワークフローと14のデータプロバイダーを備えた Computer for Professional Finance、そして corporate finance と case law の Vals AI ベンチマークで #1 にランクされた Grok 4.3 です。この収束は偶然ではありません。金融は、構造化文書の量、精度要件、プレミアムツールのコスト許容度を兼ね備えており、価値の高い業務ドメインを持つ自律エージェントの初期展開に理想的な場となっています。

デフォルトモデルをめぐる競争。 GPT-5.5 Instant は直前のモデルに比べて幻覚を52.5%削減し、Grok 4.3 は測定・公開された agentic パフォーマンスとともに100万トークンのコンテキストに到達しました。これら2つのモデルは同じ日に発表されています。争点はもはや学術ベンチマークで最良を発表することだけではなく、一般向けインターフェース（ChatGPT）でデフォルトとして読み込まれる、または開発者パイプライン（xAI API）で最初に有効化されるモデルになることです。

開発者向けセキュリティ標準としての MCP。 GitHub は、MCP サーバーを通じて同時に3つのセキュリティ更新を公開しました（secret scanning の GA、dependency scanning のプレビュー、code-to-cloud の GA）。この協調的な展開は、GitHub の MCP サーバーをコードエージェント向けのネイティブなセキュリティ統合チャネルへと変えます。Copilot CLI、VS Code、および MCP 対応の任意の IDE は、これから毎コミット前に、ワークフロー内で直接、秘密情報や脆弱な依存関係をスキャンできます。

永続エージェントとリアルタイムインフラ。 Runway Characters（画像から1.75秒遅延のビデオエージェント）、ServiceNow の Project Arc（長時間稼働するデスクトップエージェント）、OpenClaw/NemoClaw（GitHub スター25万、推論 AI の1,000倍の推論需要）そして Genspark sb-git（エージェント向けに再設計された Git）は、いずれも同じ転換を示しています。つまり、AI エージェントは単発クエリの時代を抜け出し、状態保存、リアルタイム遅延、ネイティブなバージョニングを必要とする、根本的に異なるインフラ要件を持つ永続プロセスの時代へと入っています。