Anthropic の RSP v3.0、GPT-5.3-Codex が一般提供に、Meta が AMD と約6 GW の GPU 契約締結

Anthropic はセキュリティ方針を大幅に見直し、Frontier Safety Roadmap（公開の安全ロードマップ）と外部レビュー付きの四半期ごとの Risk Reports を導入する Responsible Scaling Policy v3.0 を発表しました。OpenAI は GPT-5.3-Codex の限定アクセス期間を終了し、Responses API 経由で全ての開発者に提供を開始しました。Meta は AMD と複数年契約を結び、同社のモデル向けに約 6 GW の GPU 容量を確保します。Qwen は 4 つの MoE モデルを発表し、そのうち 35B-A3B が自社の 235B モデルを上回る結果を示しました。Claude Code はモバイルからセッションを継続できる Remote Control を導入しました。

Anthropic：Responsible Scaling Policy v3.0

2月24日 — Anthropic は、同社モデルに伴う壊滅的リスクを管理する自主枠組みである Responsible Scaling Policy（RSP）の第3版を公開しました。

オリジナルの RSP は 2023年9月に発表されました。2年半でモデルは新たな能力（ウェブナビゲーション、コード実行、コンピュータ操作、多段階の自律的アクション）を獲得し、それぞれの新能力が新たなリスクをもたらしました。

うまく行った点

RSP により Anthropic はより頑強なガードレール（例：ASL-3 に必要な生物兵器関連コンテンツをブロックするための分類器など）を開発することを促されました。ASL-3 の基準は 2025年5月に発動され、運用中です。OpenAI や Google DeepMind も初期発表の数カ月後に類似のフレームワークを採用しました。RSP はまた、法整備（カリフォルニアの SB 53、EU AI Act）への情報提供にも寄与しました。

うまく行かなかった点

能力の閾値は実務では予想より曖昧であることが明らかになりました — モデルが「確実に」閾値を超えたかどうかを判断するのは困難です。政府側の追従も期待ほど迅速ではなく、規制に否定的な政治状況が影響しました。ASL の高いレベル（ASL-4、ASL-5）に対する一部の要求は、一方的に満たすことが不可能かもしれません。

RSP v3.0 の主要な3点の変更

v3.0 では、Anthropic が他のアクターに依存せず単独で実行するコミットメントと、業界全体で採用すべき能力→緩和策のマッピングを区別しています。

並行して公開された第二の文書である Frontier Safety Roadmap は具体的な公開目標を定めています：モデル重みを安全化するためのムーンショット的な R&D プロジェクトの開始、数百人を上回る人間参加者を凌駕する自動化 red-teaming の開発、AI 開発の全ての重要活動の集中レジストリの確立などです。

最後に、Anthropic は 3〜6 か月ごとに Risk Reports を公開することを約束しています：モデルのセキュリティプロファイル、能力／脅威／緩和策の整合、そして最も高度なモデルについては、レポートへの非検閲アクセスを伴う独立専門家によるレビューを実施します。

“We’re updating our Responsible Scaling Policy to its third version. Since it came into effect in 2023, we’ve learned a lot about the RSP’s benefits and its shortcomings. This update improves the policy, reinforcing what worked and committing us to even greater transparency.”

🇯🇵 私たちは Responsible Scaling Policy を第3版に更新します。2023年の施行以来、その強みと限界について多くのことを学びました。この更新は、うまく機能した点を強化し、より高い透明性に向けて取り組むことで方針を改善します。 — X上の @AnthropicAI

🔗 RSP v3.0（Anthropic）

OpenAI：GPT-5.3-Codex が一般提供

2月24日 — GPT-5.3-Codex が OpenAI の Responses API を通じて全ての開発者に提供されるようになりました。このモデルは 2月初めに限定アクセスでリリースされていましたが、今回一般提供へ移行しました。

GPT-5.3-Codex はコーディング性能（frontier）と専門的知識能力を単一モデルに統合しています。最初の導入者からのフィードバックによれば、「著しく強力で、GPT-5.2 と比べて token あたり 3〜4 倍効率的」であるとされています。プラットフォーム Lovable は最も複雑なユースケースの一つで早期採用した例の一つです。

このモデルはまた、OpenRouter 経由でも利用可能で、OpenAI API を直接使わずに既存のワークフローへ統合したい開発者向けの選択肢が提供されています。

Élément	Détail
Disponibilité	Responses API (accès général)
Efficacité	3-4x plus efficace en tokens vs GPT-5.2
Accès alternatif	OpenRouter

🔗 ツイート @OpenAIDevs

Meta + AMD：約6 GW の GPU を伴う複数年契約

2月24日 — Meta は AMD と複数年にわたるパートナーシップを発表し、最新の AMD Instinct GPU を同社のグローバルインフラに導入します。

配備は約 6 GW のデータセンター容量 を想定しており、最先端の AI モデルの開発を進め、何十億ものユーザーに「パーソナルなスーパーインテリジェンス」をもたらすことを目標としています。

“Today we’re announcing a multi-year agreement with @AMD to integrate their latest Instinct GPUs into our global infrastructure. With approximately 6GW of planned data center capacity dedicated to this deployment, we’re scaling our compute capacity to accelerate the development of cutting-edge AI models and deliver personal superintelligence to billions around the world.”

🇯🇵 本日、@AMD と複数年にわたる契約を発表し、彼らの最新の GPU Instinct を当社のグローバルインフラに統合します。この導入には約 6 GW のデータセンター容量が見込まれており、最先端の AI モデル開発を加速し、何十億もの人々にパーソナルなスーパーインテリジェンスを提供するために計算能力を増強します。 — X上の @AIatMeta

この合意は、これまで主に NVIDIA に依存してきた Meta にとって GPU サプライヤーの大幅な多様化を意味します。6 GW という規模の契約は、次世代モデル向けのコンピュートに対する Meta の野心を示す強いシグナルです。

🔗 ツイート @AIatMeta

Qwen 3.5 Medium Series：4 つの MoE モデル、「More intelligence, less compute」

2月24日 — Alibaba の Qwen は Qwen 3.5 Medium シリーズを発表し、4 つの MoE（Mixture of Experts）アーキテクチャモデルを投入しました。

注目すべき成果は Qwen3.5-35B-A3B：総パラメータ 35B のうち 3B のアクティブパラメータで、同社の以前の大型モデル Qwen3-235B-A22B を上回る性能を示しました。MoE アーキテクチャと大規模 RL トレーニングにより、この高密度の効率が実現されています。

Modèle	Paramètres actifs	Note
Qwen3.5-Flash	—	Contexte 1M tokens, outils intégrés, hébergé
Qwen3.5-35B-A3B	3B actifs / 35B total	Surpasse Qwen3-235B-A22B
Qwen3.5-122B-A10B	10B actifs / 122B total	—
Qwen3.5-27B	27B	—

Qwen3.5-Flash はシリーズのホステッド版で、デフォルトで 100万 token のコンテキストと統合ツールを備えています。モデルは HuggingFace、ModelScope、Qwen Chat 上で利用可能です。

🔗 ツイート @Alibaba_Qwen

Claude Code v2.1.51：モバイルからの Remote Control

2月24日 — Claude Code v2.1.51 は remote-control を導入し、このバージョンで最も期待されていた機能、端末で開始したローカルセッションを携帯電話から継続できる Remote Control を実装しました。

ターミナルから開始した Claude Code セッションは /remote-control を介して Claude Code のモバイルアプリで再開できます。機能は research preview として Max ユーザーに提供されています。

Remote Control に加え、このバージョンは複数の技術的改善を含みます：

Changement	Détail
Plugin marketplace timeout	Git : 30s → 120s, configurable via `CLAUDE_CODE_PLUGIN_GIT_TIMEOUT_MS`
npm registries	Support registres personnalisés et pinning de version pour plugins
BashTool	Skip login shell par défaut quand snapshot disponible
Hooks sécurité	Fix : `statusLine` et `fileSuggestion` hooks sans acceptation workspace trust
Réduction contexte	Tool results > 50K chars persistés sur disque (était 100K)

🔗 Claude Code の CHANGELOG

Claude Cowork：企業向けプライベート plugin マーケットプレイスとクロスアプリ調整

2月24日 — Anthropic は Cowork の大規模アップデートを公開し、企業向けのプライベート plugin マーケットプレイス、新しいコネクタ、およびクロスアプリケーションのオーケストレーションを導入しました。

管理者は組織向けの プライベート plugin マーケットプレイス を作成できるようになりました：テンプレートから、またはゼロから作成可能で、設定は Claude がガイドします。新しい統合メニュー「Customize」が plugins、skills、コネクタ（MCP）を一元化します。管理者はユーザー単位でのプロビジョニング、自己インストール、プライベート GitHub リポジトリ（ベータ）からの plugin ソース取得なども行えます。

コネクタ面では、Google Workspace（Calendar、Drive、Gmail）、Docusign、Apollo、Clay、Outreach、Similarweb、MSCI、LegalZoom、FactSet、WordPress、Harvey などが追加されました。Slack、LSEG、S&P Global、Tribe AI といった企業も plugin を公開しています。

部門別の新しい plugin テンプレート も提供されます：

Département	Exemples de workflows
RH	Lettres d’offre, onboarding, évaluations performance
Design	Critiques UX, audits accessibilité, plans recherche utilisateur
Engineering	Standups, incident response, checklists deploy, postmortems
Opérations	Documentation processus, évaluation fournisseurs
Finance	Analyse de marché, modélisation financière, slides PowerPoint
Investment Banking	Documents de transaction, analyses comparables
Private Equity	Due diligence, scoring par critères d’investissement

Claude は今や Excel と PowerPoint 間のタスクをオーケストレーション できます — Excel でデータを解析し、PowerPoint でプレゼンテーションを生成する際に、add-in 間でコンテキストを渡すことが可能です。この機能は Mac と Windows の有料プラン全てに対して research preview として提供されています。

最後に、OpenTelemetry のサポートにより管理者はチームごとの使用状況、コスト、ツールのアクティビティを追跡できます。

🔗 Cowork plugins（企業向け）ブログ 🔗 ツイート @claudeai

OpenAI：Codex CLI v0.99.0

2月24日 — Codex CLI が v0.99.0 にアップデートされ、複数の新機能が追加されました。

コマンド /statusline により、TUI のフッターに表示されるメタデータをカスタマイズできるようになりました。添付ファイルとして GIF と WebP の画像が受け入れられます。直接シェルコマンドの実行は現在のターンをブロックしなくなり、並行して実行できるようになりました。シェル環境と rc ファイルのスナップショットがデフォルトで有効になりました。

Feature	Détail
`/statusline`	Configurer le footer TUI interactivement
Images GIF/WebP	Nouveaux formats acceptés en pièces jointes
Shell snapshot	Snapshot de l’environnement shell et rc files
App-server APIs	Turn/steer, feature discovery, resume_agent
Web search control	Modes restreints via `requirements.toml` (Enterprise)

セキュリティ修正（RUSTSEC-2026-0009）も含まれています。

npm install -g @openai/codex@0.99.0

🔗 Codex Changelog v0.99.0

DeepSeek-V3.2：正式版

2月24日 — DeepSeek は実験版 V3.2-Exp に続く正式版 DeepSeek-V3.2 を発表しました。

deepseek.com のバナーによれば、V3.2 は Agent 機能を強化し、thinking/reasoning（熟慮的推論）を統合しています。バージョンはウェブ、モバイルアプリ、API で利用可能です。詳細な技術情報は WeChat（DeepSeek の中国向け主要発表チャネル）に掲載されています。

🔗 deepseek.com

Perplexity と Comet：全ユーザー向け音声モード

2月24日 — Perplexity は Perplexity と同社ブラウザ Comet の音声モードを大幅にアップデートし、サブスクライバーに限らず全ユーザーに展開しました。

Comet の新しい音声モードは、画面に表示されている内容に基づいて AI に質問し、音声でウェブサイト間を移動し、複数タブにわたる会話のコンテキストを保持することを可能にします。このマルチタブのコンテキスト持続は従来の音声アシスタントより前進した点です。

Aspect	Détail
Disponibilité	Tous les utilisateurs (pas uniquement abonnés)
Plateformes	Android, Mac, Windows
Fonctionnalité clé	Navigation vocale multi-onglets avec contexte persistant

🔗 ツイート @perplexity_ai 🔗 ツイート @comet

Google DeepMind：Music AI Sandbox × Wyclef Jean

2月24日 — Google DeepMind と YouTube は、プロデューサー兼アーティストの Wyclef Jean と協力した Music AI Sandbox を発表しました。

Music AI Sandbox は Lyria 3（2月18日に発表された音楽生成モデル）を基盤とし、プロのミュージシャンが創作のパートナーとして AI を試せる環境を提供します。Wyclef Jean はこれらのツールを用いて「Back from Abu Dhabi」という楽曲を制作しました。制作過程は YouTube の動画で公開されています。

このコラボレーションは、Google DeepMind が実スタジオ環境での AI 音楽利用を探る一連のアーティスト協業の一部です。

🔗 ツイート @GoogleAI 🔗 ツイート @GoogleDeepMind

Google DeepMind：ヨーロッパで Robotics Accelerator を開始

2月24日 — Google DeepMind はロボティクス分野のスタートアップ向けプログラム、Robotics Accelerator をヨーロッパで開始すると発表しました。

目的は技術と商業的な活路との間のギャップを埋め、次世代の物理エージェントを加速することです。プログラムはスタートアップ向けに設計され、Google DeepMind のリソースと専門知識へのアクセスを提供します。

🔗 ツイート @GoogleDeepMind

NVIDIA + Red Hat：企業向け AI Factory

2月24日 — Red Hat と NVIDIA は共同で Red Hat AI Factory with NVIDIA を発表し、企業における AI 採用を加速する統合ソリューションを提供します。

このプラットフォームは Red Hat AI Enterprise（モデルのオーケストレーションとデプロイメント）と NVIDIA AI Enterprise（NVIDIA GPU 向けに最適化されたソフトウェア層）を組み合わせています。目的は、AI アプリケーションを本番環境で展開する組織の運用複雑性と総所有コストを削減することです。

🔗 ツイート @NVIDIAAI

Black Forest Labs：Safety Evaluation — 脆弱性が 10 倍少ない結果

2月24日 — Black Forest Labs は独立したサードパーティ評価を公開し、自社の FLUX モデルに関する新興リスクを評価しました。

結果は、他の一般的なオープンウェイト画像モデルと比べて 10倍以上少ない脆弱性 を示しました。 BFLは、高性能、オープンイノベーション、ガードレールが共存できると主張している — オープンソースの画像モデル業界では珍しい透明性の取り組みだ。

🔗 ツイート @bfl_ml

概要

Claude Code v2.1.52 — v2.1.51に続けて公開された対象パッチ：Windows上のVS Code拡張のクラッシュを修正（command 'claude-vscode.editor.openLast' not found）。新機能なし。

GitHub Copilot SDK — PowerPoint用エージェント — GitHubはデモ（2月23日）を共有し、Copilot SDKで最新のドキュメントを検索し、既存のスライドを解析してそのスタイルを再現し、PowerPoint内で直接新しいスライドを生成できるエージェントを構築する方法を示した。🔗 ツイート @github

Runway — Interior Designer — Runwayはクリエイティブなユースケースを提示：部屋の写真をNano Banana Pro、Kling 3.0、Gen-4.5の組み合わせでパーソナライズされたインテリアデザインに変換する。2月20日にローンチしたマルチモデルプラットフォームを示すマーケティングデモ。🔗 ツイート @runwayml

これが意味すること

AnthropicのRSP v3.0は、AI安全性アプローチの転換点を示している：Frontier Safety Roadmapを通じて目標を公開し、外部レビュー付きのリスクレポート（Risk Reports）を約束することで、Anthropicは内部方針から公的責任のメカニズムへ移行した。これは業界全体への穏やかなプレッシャーであり、展開決定の不透明性に対する暗黙の応答でもある。

MetaとAMDの6GW契約はNVIDIAに対する警鐘だ：これまでMetaが採用してきた唯一のGPU供給者が正面から競合され始めている。AMDにとっては、Instinct GPUがトレーニングワークロードにおいてH100/H200に対してまだ苦戦している中で、大規模な検証を得た格好だ。

Qwen 3.5 Mediumは、MoEアーキテクチャがもはや極めて大規模なモデルの専有物ではないことを示している：35B-A3Bが235Bを上回るというのは、巨大モデルを動かすためのインフラを持たない人々にも届く、著しい「知能の圧縮」である。

出典

この文書は gpt-5-mini モデルを使用して fr 版から ja 言語に翻訳されました。翻訳プロセスの詳細については https://gitlab.com/jls42/ai-powered-markdown-translator をご覧ください。