検索

Anthropic Institute、Perplexity Everything is Computer、OpenAI Responses API:2026年3月11日

Anthropic Institute、Perplexity Everything is Computer、OpenAI Responses API:2026年3月11日

2026年3月11日は密度の高い一日だった。Anthropicは強力なAIをめぐる公共的議論のための学際的な研究所を設立し、Perplexityは4つのAPIを同時に発表して「Computer」ビジョンを展開、OpenAIはResponses APIの新しいエージェント向けプリミティブを公開し、Metaは2年間で開発した4世代のカスタムAIチップを詳説した。


Anthropic Institute:Jack Clarkが公共利益部門を率いる

2026年3月11日 — Anthropicは、強力なAIがもたらす課題に関する公共的議論を前進させるための新たな取り組み、The Anthropic Instituteを立ち上げた。この取り組みは共同創業者のJack Clarkが率い、Anthropicで「Head of Public Benefit」(公共利益責任者)という新たな役割に就く。

同研究所は、研究者、経済学者、法律家、公共政策の専門家からなる学際的チームを集め、Anthropicの最先端モデルへの独自のアクセスを持つ。その使命は、AIの社会的・経済的・安全保障上の影響を、それらが発展するにつれて分析し、伝えることだ。

最初の3名の採用が発表された:

採用者経歴
Matt BotvinickResident Fellow, Yale Law School;元Senior Director of Research, Google DeepMind
Anton Korinek経済学教授(サバティカル中)、Economic Researchチーム
Zoë Hitzig元OpenAI、AIの社会的・経済的影響を専門

同研究所は、Anthropicの既存チームであるFrontier Red Team、Societal Impacts、Economic Researchを土台とする。同時にAnthropicは、モデルの透明性、エネルギー消費者保護、輸出管理、AIのグローバルガバナンスに注力するPublic Policyチームの拡大も発表した。

この研究所の設立は注目すべき節目だ。Anthropicは公共への関与を正式に組織化し、共同創業者の一人をその顔として据えた。

🔗 The Anthropic Instituteの紹介


Perplexity:「Everything is Computer」ビジョンを協調して発表

2026年3月11日 — Perplexityは、「Computer」ビジョン、すなわち個人用・業務用コンピューターとしてのAIを軸にした4つの発表を同時に公開した。

Personal ComputerとEnterprise

Personal Computerは、24時間365日稼働する専用Mac miniで、ローカルアプリケーションとPerplexityのサーバーに接続される。ユーザーのデジタルプロキシとして機能し、機微な操作には明示的な承認が必要となる。待機リストが公開されている。

Computer for Enterpriseは、Snowflake、Salesforce、HubSpot、数百のプラットフォームに接続される。スキル(skills)はカスタマイズ可能で、Slack統合によりDMや共有チャンネル内で作業できる。SOC 2 Type II、SAML SSO、監査ログ(audit logs)に基づいている。Perplexityは、16,000件のリクエストを対象にした社内調査に基づき、労働コストで160万ドルの削減、4週間で3.25年分の作業達成という数値を示している。

Comet Enterpriseは、管理者コントロール(ドメインごとの権限、アクションログ、MDM)を備えたAIネイティブブラウザであり、ブラウザレベルの保護についてCrowdStrikeと提携している。

Perplexity Financeには、SEC filings、FactSet、S&P Global、Coinbase、LSEG、Quartr、Polymarketなど40以上のリアルタイム金融ツールが追加され、Plaidを介した証券会社接続により実際のポートフォリオ分析が可能になる。

Premium Sourcesは、Statista、CB Insights、PitchBookへのアクセスを検索フロー内で直接提供する。有料ソースは自動的に引用される。

🔗 Everything is Computer

Agent API:完全なオーケストレーションランタイム

Agent APIは、統合検索、ツール実行、マルチモデルのオーケストレーションを備えたエージェント型ワークフローを構築するためのマネージドランタイムだ。モデルルーター、検索レイヤー、embeddingsプロバイダー、sandboxサービス、監視スタック(monitoring stack)を、単一の統合ポイントで置き換える。

統合ツール機能
web_searchドメイン、鮮度、日付範囲、言語、コンテンツ予算によるフィルタリング
fetch_urlURLの直接取得
カスタム関数完全サポート

4つの最適化プロファイル(presets)が、ユースケースをカバーする:高速な事実検索、バランス型検索、複数ソースの詳細分析、機関向け検索。Deep Research 2.0advanced-deep-researchプロファイル経由で利用可能で、1つのリクエストごとに数十件の検索を実行し、数百件の文書を処理する。

Agent APIはモデル非依存で、ほぼ100%の可用性を実現するマルチモデルのフォールバックチェーン(fallback chains)をサポートし、docs.perplexity.aiで本日から利用可能だ。

🔗 Agent API

Search API:改善されたスニペットとSEAL benchmark

Search APIのアップデートは、抜粋(snippets)の品質と評価インフラに焦点を当てている。

新しいフラグメント単位のラベリング(span-level labeling)パイプラインは、ソース文書のどのセグメントがクエリに関連するかを識別する。その結果、より小さく、より正確な抜粋が得られ、tokenコストが削減され、下流モデルのコンテキスト管理が改善される。

SEAL benchmarkは、時間とともに答えが変化する質問に検索システムが答えられるかをテストする。PerplexityはSEAL-Hardで改善している一方、他のプロバイダーは低下している。search_evals frameworkはGitHub上でオープンソースとして更新されている。

その他の改善点:マルチクエリ対応(1つのAPIリクエストで最大5件)、言語(ISO 639-1コード)および国によるフィルタリング、3つのAPIをネイティブサポートするPython SDK(pip install perplexityai)。

🔗 Search APIアップデート

Sandbox API:エージェント向けの分離されたコード実行

Perplexityは、自社の内部コード実行環境を独立したサービスとして公開する。各セッションは分離されたKubernetes pod内で実行され、永続ファイルシステムがマウントされる。対応言語はPython、JavaScript、SQL。実行時(at runtime)のパッケージインストールも可能だ。

セッションは状態を保持する(stateful):あるステップで作成されたファイルは次のステップで利用可能であり、長時間のワークフローは一時停止して数時間後に再開できる。セキュリティはゼロトラスト(zero-trust)モデルに基づく:直接のネットワークアクセスはなく、送信トラフィックはプロキシ経由で、コードが生のAPIキーにアクセスすることはない。

Sandbox APIは、同じAPIキーと同じクレジットでAgent APIに統合可能になる。ステータス:近日中にプライベートベータ。

🔗 Sandbox API


OpenAI:Responses APIがエージェント向けコンピューター環境を獲得

2026年3月11日 — OpenAIは、信頼性の高い自律エージェントを構築するためのResponses APIの新しいプリミティブを詳説したエンジニアリング記事を公開した:Unix shell tool、ホスト型コンテナ、ネイティブなコンテキスト圧縮、再利用可能なagent skillsである。

shell tool

shell toolにより、モデルはコマンドラインを通じてコンピューターと対話でき、grep、curl、awkなどの古典的なUnixユーティリティにアクセスできる。Pythonのみを実行していた既存のコードインタープリターとは異なり、shell toolはGo、Java、Node.js、その他の環境に対応する。GPT-5.2以降のモデルは、shellコマンドを提案するよう訓練されている。

Responses APIは、個別のコンテナセッションを通じて複数のshellコマンドを並列実行でき、コンテキストウィンドウを飽和させないよう、コマンドごとに出力上限を適用する。

ホスト型コンテナ

コンテナはモデルのワークスペースとなる:

コンポーネント説明
ファイルシステムcontainer APIおよびfile APIを介したリソースのアップロード、整理、管理
データベース構造化ストレージ(SQLite)— モデルは全コンテンツを読み込むのではなくテーブルを照会する
ネットワークアクセス許可リスト付きの集中型egressプロキシ、ドメインごとのシークレット注入

ネイティブなコンテキスト圧縮

長時間タスク向けに、Responses APIはネイティブな圧縮メカニズムを統合している:モデルは会話状態のコンパクトで暗号化された表現を生成するよう訓練されている。サーバー側(設定可能なしきい値)または/compact endpoint経由で利用可能。Codexはこのメカニズムを使い、劣化なしに長時間のコーディングセッションを維持している。

Agent skills

スキル(agent skills)は、反復的なワークフローパターン(workflow patterns)を再利用可能なbundleとして条件付ける:SKILL.mdファイルと関連リソースを含むフォルダだ。Responses APIは、モデルにpromptを送信する前に、自動的にskillをコンテキストへ読み込む。skillsはAPI経由で管理され、バージョン管理される。

同時に、開発者向けブログ記事では、Responses APIの1周年を5つの顧客事例とともに祝っている。2つの公開記事は、プラットフォームがエージェント型へ進化していることを一貫した形で示している。

🔗 Responses API + コンピューター環境 🔗 Responses APIの1年


OpenAI:prompt injectionへの防御戦略

2026年3月11日 — OpenAIは、prompt injection攻撃に対するAIエージェントの耐性に関するセキュリティ記事を公開した。

初期の攻撃は、外部コンテンツ(Wikipediaページ、メール)に直接的な指示を挿入するものだった。モデルの改善に伴い、これらの攻撃はソーシャルエンジニアリング(social engineering)へと進化した:説得力のある業務文脈、偽装された緊急性、主張された権限である。記事で説明されている2025年の例では、ChatGPTの旧バージョンに対して50%のケースで攻撃が成功していた。

OpenAIはこの問題を、雇用主/エージェント/悪意ある第三者という三者システムの観点から捉えている。これは、操作を試みる相手にさらされる人間のカスタマーサービス担当者に類似している。目的はすべての攻撃を完全に特定することではなく、操作が成功した場合の影響を制限することだ。

対策説明
source-sink分析信頼できないコンテンツ + 危険なアクションの組み合わせを検出
Safe Url会話内の情報が第三者に送信されるかを検出し、確認を求めるかブロックする
アプリケーションsandboxCanvasとChatGPT Appsが予期しない通信を検出し、同意を求める

Safe Urlは、Atlas内のナビゲーション、およびDeep Research内の検索とナビゲーションにも適用される。

🔗 prompt injectionに耐えるAIエージェントの設計


Meta MTIA:2年間で4世代のAIチップ

2026年3月11日 — Metaは、カスタムAIチップファミリーMTIA(Meta Training and Inference Accelerator)に関する詳細な技術記事を公開した。Metaは2年間で4世代を連続して開発し、数十億人のユーザーに低コストでサービスを提供することを目指している。

「AIモデルは、従来のチップ開発サイクルよりも速く進化している。」

🇯🇵 AIモデルは、従来のチップ開発サイクルよりも速く進化している。

世代主なイノベーション
MTIA 300ランキングと推薦モデル(Ranking & Recommendation)向けに最適化された最初のチップ、再利用可能なモジュール基盤
MTIA 400GenAI workloadsへの進化、単一のscale-upドメイン内に72チップのrack
MTIA 450HBM帯域幅を倍増、MX4 FLOPSを+75%、attentionとFFNのハードウェア高速化
MTIA 500MTIA 450比でHBM帯域幅+50%、GenAI inferenceに注力

MTIA 300からMTIA 500までの進歩は、HBM帯域幅が4.5倍、FLOPSが25倍である。Metaの戦略は、高速な開発(年1回の新チップ)、事前学習よりもinferenceへの注力、そしてPyTorchとのネイティブ統合に基づく。

「主流のGPUは通常、最も要求の厳しいworkload、すなわち大規模なGenAI事前学習向けに構築されている一方、Metaの主なニーズはinferenceである。」

🇯🇵 主流のGPUは通常、最も要求の厳しいworkload、すなわち大規模なGenAI事前学習向けに構築されている一方、Metaの主なニーズはinferenceである。

基本プロセッサ(Processing Element)のアーキテクチャは、2つのベクトルRISC-Vコア、ドット積エンジン(Dot Product Engine)、特殊関数ユニット(Special Function Unit)、リダクションエンジン、DMAを組み合わせている。ソフトウェアスタックはPyTorch、vLLM、Triton、専用MTIAコンパイラに基づき、pluginアーキテクチャを介したvLLM統合を備える。

🔗 Meta MTIA:数十億人のためにAIチップをスケールする


Gemini CLI v0.33.0:強化された Plan Mode と A2A 認証

2026年3月11日 — Gemini CLI が v0.33.0 を公開。Plan Mode を導入した v0.32.0 から2週間後のリリースです。

カテゴリ新機能
エージェントアーキテクチャリモート A2A エージェント向け HTTP 認証、認証済み A2A エージェントカードの検出
Plan Mode組み込み検索サブエージェント、ユーザーフィードバック用アノテーションのサポート、新しいサブコマンド copy
CLI インターフェースASCII アイコン付きコンパクトヘッダー、コンテキストウィンドウの反転表示、チャット履歴のデフォルト30日保持

A2A(Agent-to-Agent)プロトコル向け HTTP 認証の追加が、主要な技術的新機能です。Gemini CLI はリモートエージェントを検出し認証できるようになり、安全なマルチエージェントオーケストレーションの基盤を整えます。

🔗 Gemini CLI Changelog


Chrome の Gemini:インド、ニュージーランド、カナダへ拡大

2026年3月11日 — Google は Chrome の AI 機能を3つの新市場、インド、ニュージーランド、カナダへ拡大します。

Gemini in Chrome — Gemini 3.1 ベースのサイドパネル内 AI アシスタント — が、これらの地域の Mac、Windows、Chromebook Plus で利用可能になりました。展開される機能には、Chrome から Gmail、Maps、Calendar、YouTube へのアクセス、複数の開いているタブの横断分析、Nano Banana 2 によるブラウザ内での直接的な画像変換が含まれます。このアップデートでは、ヒンディー語、フランス語、スペイン語を含む50以上の追加言語も加わります。

🔗 Chrome がインド、ニュージーランド、カナダへ拡大


AlphaEvolve:5つのラムゼー数に新たな下界

2026年3月11日 — Pushmeet Kohli(Google DeepMind)は、AlphaEvolve が極値組合せ論における5つの古典的ラムゼー数について新たな下界を確立したと発表しました。これらはエルデシュ自身もその複雑さに言及したほど難しい問題で、従来の最良結果は少なくとも10年前のものでした。

AlphaEvolve は、歴史的には個別のアルゴリズムを手作業で設計する必要があった探索手順を自動的に発見するメタアルゴリズムとして機能します。この成果は、AlphaEvolve がすでに知られていた Google のカーネル最適化を超える能力を示しています。

🔗 Pushmeet Kohli のツイート


Gemini Embedding 2:Google 初のマルチモーダル embedding

2026年3月10日 — Google は Gemini Embedding 2 を発表し、“our most capable and first fully multimodal embedding model” と説明しています。これは Google 初のネイティブなマルチモーダル embedding モデルで、Gemini API と AI Studio を通じて開発者が利用できます。

🔗 @googleaidevs のツイート


GitHub Copilot:ターミナルからのコードレビューと JetBrains の進化

2026年3月11日 — GitHub Copilot に2つの注目すべきアップデート。

GitHub CLI v2.88.0 からの Code Review

ターミナルから直接 Copilot にコードレビューを依頼できるようになりました。コマンド gh pr edit --add-reviewer @copilot(非対話モード)と gh pr create(対話モード)により、Copilot がチームメイトと並んで統合されます。レビュアー選択には動的検索が導入され、大規模組織でのパフォーマンスが向上し、アクセシビリティの問題も修正されます。Copilot code review を含むすべてのプランで利用可能 — GitHub CLI v2.88.0 へのアップデートが必要です。

🔗 GitHub CLI からの Code Review

JetBrains IDE 向けエージェント機能の改善

JetBrains plugin のアップデートにより、一般提供(GA)として、カスタムエージェント(custom agents)、サブエージェント、計画エージェント(plan agent)、および全プラン向けのモデル自動選択が提供されます。公開プレビュー(public preview)では、.github/hooks/ 内の hooks.json ファイルを通じた agent hooksuserPromptSubmittedpreToolUsepostToolUseerrorOccurred)と、AGENTS.md および CLAUDE.md ファイルのサポートが含まれます。

その他の改善として、MCP ごとに設定可能な auto-approve、拡張推論モデル向けの思考パネル、コンテキストウィンドウ使用量インジケーター、メニュー内の Edit モードの非推奨化が追加されています。

🔗 JetBrains の改善

Web 上の Copilot でリポジトリを探索

公開プレビューとして、Copilot の Web インターフェースから GitHub リポジトリのツリーを直接探索できるようになりました。選択したファイルはチャットの一時参照として自動的に追加され、永続化することもできます。

🔗 Copilot でのリポジトリ探索


Anthropic Sydney と Claude for Office

Sydney、アジア太平洋で4番目の拠点

2026年3月10日 — Anthropic は、アジア太平洋で4番目(東京、ソウル、シンガポールに続く)となる Sydney オフィスを近く開設すると発表しました。オーストラリアは1人あたりの Claude.ai 利用で世界4位、ニュージーランドは同じ指標(Anthropic Economic Index)で8位です。このオフィスは当初、企業顧客、スタートアップ、研究に注力します。

🔗 Sydney、アジア太平洋で4番目の拠点

Claude for Excel と PowerPoint:共有コンテキストと Office Skills

2026年3月11日 — Claude for Excel と Claude for PowerPoint の add-ins に2つの重要なアップデートが加わります。2つのアプリ間でのコンテキスト共有(アナリストが1つの会話の中で Excel ブックからデータを抽出し、PowerPoint プレゼンテーションで利用できる)と、両 add-ins への Skills(ワンクリックで再利用可能な workflows)の導入です。

事前読み込み済みの Skills は、数式監査、LBO/DCF モデル構築、競合環境デック、新しいデータによるプレゼンテーション更新、投資銀行デックのレビューといった最も一般的なユースケースをカバーします。add-ins は、コンプライアンス対応のデプロイ向けに Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 経由でも利用可能になりました。提供環境:有料プラン(Pro、Max、Team、Enterprise)の Mac と Windows。

🔗 Claude for Excel と PowerPoint


NVIDIA Nemotron 3 Super、ComfyUI、GTC 2026

2026年3月11日 — NVIDIA は GTC 2026 をめぐって非常に活発です。

Nemotron 3 Super は、前世代と比べてエージェント型 AI 向けに5倍のスループットを提供します。これは1200億パラメータのオープンソース MoE(Mixture of Experts)モデルで、高頻度の推論ワークロード向けに最適化されています。

NVIDIA と ComfyUI は GDC 2026(Game Developers Conference)で、ゲーム開発者やクリエイター向けにローカル AI 動画生成を簡素化する統合を発表しました。FLUX と LTX-Video モデルをサポートします。

NVIDIA ブログの GTC 2026 Live Updates は、San Jose でのカンファレンス発表をライブで集約しています。この場では Mistral AI も frontier モデルを紹介しています。

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live


要約

Runway Labs — Runway は、Alejandro Matamala Ortiz(共同創業者、イノベーション責任者)が率いる社内インキュベーターを立ち上げます。Runway Labs は、映画、医療、教育、ゲーム、広告、不動産など多様な分野で、生成動画と世界シミュレーションモデル(General World Models)向けの根本的に新しいアプリケーションをプロトタイプ化します。採用を開始しています。

🔗 Runway Labs の紹介

Claude Code /btw — 新しいコマンド /btw により、タスクの実行中に進行中の作業を中断することなく、横道の会話(side chain conversations)を行えるようになります。

🔗 @bcherny のツイート

NotebookLM Flashcards — クイズと flashcards のアップデート:中断した場所からの再開、正解・不正解だった flashcards の追跡、flashcards の削除またはシャッフルが可能に。

🔗 NotebookLM のツイート

Meta Canopy Height Maps v2 — Meta と World Resources Institute は、世界の森林樹冠高マップの新バージョン CHMv2 を公開しました。Meta の自己教師ありビジョンモデル DINOv3 により、精度と世界的なカバレッジが向上しています。用途:気候移住、森林再生、都市計画。モデルはオープンソースで利用可能です。

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5 は、2026年2月のローンチ以降 Pro ユーザー限定でしたが、Lite ユーザー(無料ティア)も利用できるようになりました。

🔗 @ZixuanLi_ のツイート


これが意味すること

2026年3月11日は、収束しつつある2つの大きな潮流を示しています。

1つ目は、エージェント機能のプラットフォーム化です。OpenAI、Perplexity、GitHub は同じ日に補完的なプリミティブ(shell tools、sandboxes、agent hooks、code review)を公開しました。エコシステムは、開発者がインフラを再発明することなく信頼できるエージェントを構築できるよう、skills、コンテナ、サブエージェントといった再利用可能なブロックを中心に構造化されつつあります。

2つ目は、カスタムシリコン競争です。Meta が2年間で4世代の MTIA について公開した詳細は、大規模推論向けに調整された、一般向け GPU への依存からの独立という明確な戦略を示しています。同じ論理が、発表が相次ぐ GTC 当日に NVIDIA が Nemotron 3 Super を公開する動きにもつながっています。

Anthropic Institute の設立は、より目立たないものの持続的な動きの一部です。能力が進歩する中で、大手 AI 企業は公共的インパクトのチームを、単なる表面的な広報ではなく、本格的な研究活動として構築しつつあります。


Sources

このドキュメントは、gpt-5.5モデルを使用してfr版からja言語に翻訳されました。翻訳プロセスの詳細については、https://gitlab.com/jls42/ai-powered-markdown-translator を参照してください。