検索

Anthropic Institute、Perplexity の Everything is Computer、OpenAI Responses API:2026年3月11日

Anthropic Institute、Perplexity の Everything is Computer、OpenAI Responses API:2026年3月11日

2026年3月11日 は盛りだくさんの日です:Anthropic は学際的な公開議論のための研究所を設立し、Perplexity は 4 つの API で「Computer」ビジョンを展開し、OpenAI は Responses API にエージェント用の完全なコンピューティング環境を追加し、Meta は 4 世代にわたるカスタム IA チップを詳細公開しました。


Anthropic Institute:Jack Clark が Public Benefit を率いる

2026年3月11日 — Anthropic は The Anthropic Institute を立ち上げ、強力な AI によって生じる課題に関する公開議論を前進させる新たな取り組みを開始しました。本イニシアチブは共同創業者の Jack Clark が引き受ける「Head of Public Benefit」(公共の利益責任者)という新しい役割の下で運営されます。

この研究所は学際的なチーム—研究者、経済学者、法律家、政策専門家—を集め、Anthropic の最先端モデルへのユニークなアクセスを提供します。ミッションは、発展する AI の社会的・経済的・安全面での影響を分析し発信することです。

最初の 3 名の採用が発表されました:

採用者経歴
Matt BotvinickResident Fellow, Yale Law School ; ex-Senior Director of Research, Google DeepMind
Anton Korinek経済学教授(サバティカル中)、Economic Research チーム
Zoë Hitzig元 OpenAI、AI の社会的・経済的影響を専門

研究所は既存の Anthropic チームに依拠します:Frontier Red Team、Societal Impacts、Economic Research。同時に Anthropic は Public Policy チームの拡張を発表し、モデルの透明性、エネルギー消費者の保護、輸出管理、グローバルな AI ガバナンスに注力します。

この研究所の設立は、Anthropic が公共への取り組みを正式に構造化し、共同創業者の一人を通じてその顔を示した点で重要な一歩です。

🔗 The Anthropic Institute の紹介


Perplexity:ビジョン「Everything is Computer」の同時ローンチ

2026年3月11日 — Perplexity は「Computer」ビジョンを中心に据えた 4 つの発表を同時に公開しました:AI を個人および業務用のコンピュータとして位置づける試みです。

Personal Computer と Enterprise

Personal Computer は 24 時間稼働する専用 Mac mini で、ローカルアプリと Perplexity のサーバーに接続されます。ユーザーの代理となるデジタルプロキシとして機能し、センシティブな操作は明示的な承認を必要とします。ウェイトリストを受付中です。

Computer for Enterprise は Snowflake、Salesforce、HubSpot など数百のプラットフォームに接続します。スキル(skills)はカスタマイズ可能で、Slack 統合により DM や共有チャンネル上で作業できます。SOC 2 Type II、SAML SSO、監査ログ(audit logs)に対応しています。Perplexity は社内調査の 16,000 件のクエリに基づく数値を提示しており:人的コストで 160 万ドルの節約、4 週間で 3.25 年分の労働相当を達成したとしています。

Comet Enterprise はネイティブの AI ブラウザで、管理者向けの制御(ドメインごとの権限、アクションログ、MDM)を備え、CrowdStrike と提携してブラウザレベルの保護を提供します。

Perplexity Finance は 40 を超えるファイナンス用ツール(SEC filings、FactSet、S&P Global、Coinbase、LSEG、Quartr、Polymarket)をリアルタイムで取り込み、Plaid 経由のブローカー接続で実口座のポートフォリオ分析を可能にします。

Premium Sources は Statista、CB Insights、PitchBook へのアクセスをリサーチフロー内で提供し、有料ソースは自動的に引用されます。

🔗 Everything is Computer

Agent API:完全なランタイムオーケストレーション

Agent API は検索統合、ツール実行、多モデルのオーケストレーションを備えたマネージドランタイムで、エージェントワークフローを構築するためのものです。モデルルーター、検索レイヤー、埋め込みプロバイダ、サンドボックスサービス、監視スタックを単一の統合点に置き換えます。

組み込みツール機能
web_searchドメイン、新しさ、日付範囲、言語、コンテンツ予算によるフィルタリング
fetch_urlURL の直接取得
カスタム関数フルサポート

4 つの最適化プリセットはユースケースをカバーします:迅速な事実検索、バランス型検索、マルチソースの深堀り分析、機関向け検索。Deep Research 2.0advanced-deep-research プロファイルで利用可能で、1 件のクエリにつき数十件の検索を立ち上げ、数百のドキュメントを処理します。

Agent API はモデルに依存せず、ほぼ 100% の可用性を目指したマルチモデルのフォールバックチェーンをサポートし、本日利用可能(docs.perplexity.ai)です。

🔗 Agent API

Search API:改善されたスニペットと SEAL ベンチマーク

Search API の更新はスニペットの品質と評価インフラに焦点を当てています。

新しいスパンレベルのラベリングパイプラインは、ドキュメント内のどのセグメントがクエリに対して関連するかを特定します。その結果、より小さく精度の高いスニペットが生成され、トークンコストが削減され下流モデルのコンテキスト管理が向上します。

SEAL ベンチマークは、検索システムが時間とともに変化する回答に対応できるかをテストします。Perplexity は SEAL-Hard で進展している一方、他のプロバイダは停滞しています。フレームワーク search_evals は GitHub でオープンソースとして更新されています。

その他の改善点:マルチクエリサポート(1 回の API リクエストで最大 5 件)、言語フィルタ(ISO 639-1 コード)と国フィルタ、そして 3 つの API をネイティブサポートする Python SDK(pip install perplexityai)。

🔗 Search API update

Sandbox API:エージェント向けの分離されたコード実行

Perplexity は内部で使用していたコード実行環境を独立サービスとして公開します。各セッションは分離された Kubernetes Pod で実行され、永続ファイルシステムがマウントされます。サポート言語:Python、JavaScript、SQL。実行時パッケージのインストール(at runtime)も可能です。

セッションはステートフルで、あるステップで作成されたファイルは次のステップで利用可能です。長期ワークフローは一時停止して数時間後に再開できます。セキュリティはゼロトラストモデルに基づき:直接ネットワークアクセスは無く、アウトバウンドはプロキシ経由、コードは生の API キーにアクセスしません。

Sandbox API は同一の API キーと同一のクレジットで Agent API に統合可能です。ステータス:間もなくプライベートベータ。

🔗 Sandbox API


OpenAI:Responses API にエージェント用のコンピューティング環境を提供

2026年3月11日 — OpenAI は Responses API を用いた自律的で信頼性の高いエージェント構築のための新しいプリミティブを詳述したエンジニアリング記事を公開しました:Unix シェルツール、ホストコンテナ、ネイティブなコンテキスト圧縮、再利用可能な agent skills などです。

シェルツール

シェルツールはモデルがコマンドラインを介してコンピュータと対話する手段を提供し、grep、curl、awk といった標準的な Unix ユーティリティにアクセスできます。従来のコードインタプリタが Python のみを実行していたのと異なり、シェルツールは Go、Java、Node.js など他の環境もサポートします。GPT-5.2 以降のモデルはシェルコマンドを提案するよう訓練されています。

Responses API は複数のシェルコマンドを別々のコンテナセッションで並列実行でき、出力量が多すぎてコンテキスト窓を圧迫しないようコマンドごとに出力上限を設けます。

ホストコンテナ

コンテナはモデルの作業領域を構成します:

コンポーネント説明
ファイルシステムcontainer と file API を通じたアップロード、整理、リソース管理
データベース構造化ストレージ(SQLite)— モデルは全体をロードする代わりにテーブルを照会
ネットワークアクセス許可リストを備えた中央プロキシ出力、ドメインごとの秘密情報注入

ネイティブなコンテキスト圧縮

長期タスク向けに、Responses API はネイティブなコンテキスト圧縮メカニズムを組み込みます:モデルは会話状態のコンパクトで暗号化された表現を生成するよう訓練されています。サーバー側(閾値は設定可能)で利用可能、またはエンドポイント /compact 経由で利用できます。Codex はこのメカニズムを使って長時間のコーディングセッションを劣化なく維持します。

Agent skills

skills(エージェントのスキル)は反復的なワークフローパターンをバンドル化して再利用可能にします:フォルダに SKILL.md ファイルと関連リソースを入れた形です。Responses API はプロンプト送信前に自動的に skill をコンテキストに読み込みます。skills は API 経由で管理されバージョン管理されます。

同時に、開発者向けブログは Responses API の 1 年を祝う 5 件の顧客事例を取り上げています。両公開はプラットフォームのエージェント化への進化を一貫して示しています。

🔗 Responses API + コンピューティング環境 🔗 Responses API の 1 年


OpenAI:プロンプトインジェクションへの防御戦略

2026年3月11日 — OpenAI はエージェントがプロンプトインジェクション攻撃(prompt injection)に対して抵抗する方法を論じたセキュリティ記事を公開しました。

初期の攻撃は外部コンテンツ(Wikipedia のページ、メール)に直接命令を挿入するものでした。モデルの改善に伴い、これらの攻撃はソーシャルエンジニアリングに進化しました:説得力のある職務文脈、緊急性の偽装、権限の主張などです。記事に記載された 2025 年の例では、古いバージョンの ChatGPT に対し成功率が 50% に達した攻撃が示されていました。

OpenAI はこの問題を三者構成(雇用主 / エージェント / 悪意ある第三者)の視点で扱い、人間のカスタマーサポート担当者が操作に晒される状況に類比しています。目的はすべての攻撃を完全に検出することではなく、成功した操作の影響を限定することにあります。

対策説明
ソース–シンク分析信頼できないコンテンツ + 危険なアクションの組み合わせを検出
Safe Url会話の情報が第三者に渡る場合を検出し、確認を求めるかブロック
アプリケーションサンドボックスCanvas と ChatGPT Apps は予期しない通信を検出し同意を求める

Safe Url は Atlas 内のナビゲーションおよび Deep Research の検索・ナビゲーションにも適用されます。

🔗 Designing AI agents to resist prompt injection


Meta MTIA:2 年で 4 世代の IA チップ

2026年3月11日 — Meta はカスタム IA チップファミリ MTIA(Meta Training and Inference Accelerator)に関する詳細な技術記事を公開しました。2 年間で、数十億のユーザーを低コストで支えるために 4 世代の連続したチップを開発しています。

“AI models are evolving faster than traditional chip development cycles.”

🇯🇵 AI モデルは従来のチップ開発サイクルよりも速く進化しています。

世代主なイノベーション
MTIA 300ランキングとレコメンデーション(Ranking & Recommendation)向けに最適化された最初のチップ、再利用可能なモジュラ基盤
MTIA 400GenAI ワークロードへの進化、単一スケールアップ領域にラックあたり 72 チップ
MTIA 450HBM 帯域幅の倍増、FLOPS MX4 +75%、アテンションと FFN のハードウェア加速
MTIA 500MTIA 450 比で HBM 帯域幅 +50%、推論(inference)に注力

MTIA 300 から MTIA 500 の進化により:HBM 帯域幅は 4.5 倍、FLOPS は 25 倍に増加しました。Meta の戦略は高開発速度(年に 1 世代のチップ)、事前学習よりも推論に重点を置くこと、そして PyTorch へのネイティブ統合に基づいています。

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇯🇵 汎用 GPU は通常、最も負荷の高いワークロード、すなわち大規模な GenAI の事前学習向けに設計されますが、Meta の主要なニーズは推論です。

基本処理要素(Processing Element)のアーキテクチャは、2 つの RISC-V ベクトルコア、ドットプロダクトエンジン(Dot Product Engine)、特殊関数ユニット(Special Function Unit)、リダクションエンジン、DMA を組み合わせています。ソフトウェアスタックは PyTorch、vLLM、Triton、専用の MTIA コンパイラに依存しており、プラグイン方式のアーキテクチャで vLLM と統合されています。

🔗 Meta MTIA:scale AI chips for billions


Gemini CLI v0.33.0:Plan Mode の拡張と A2A 認証

2026年3月11日 — Gemini CLI は v0.33.0 を公開しました。これは Plan Mode を導入した v0.32.0 の 2 週間後のリリースです。

カテゴリ新機能
エージェントアーキテクチャリモート A2A エージェント向けの HTTP 認証、認証された A2A エージェントマップの検出
Plan Mode組み込みのサーチ用サブエージェント、ユーザーフィードバック用注釈のサポート、新しいサブコマンド copy
CLI インターフェースASCII アイコンを含むコンパクトヘッダ、コンテキストウィンドウの反転表示、チャット履歴の既定保持期間 30 日

A2A(Agent-to-Agent)プロトコル向けの HTTP 認証の追加が技術的ハイライトです:Gemini CLI はこれによりリモートエージェントを検出し認証できるようになり、安全なマルチエージェントオーケストレーションの基礎を築きます。

🔗 Changelog Gemini CLI


Chrome の Gemini:インド、ニュージーランド、カナダへ拡大

2026年3月11日 — Google は Chrome の AI 機能を 3 つの新市場に拡大しました:インド、ニュージーランド、カナダ。

Gemini in Chrome — サイドパネル内の AI アシスタント(Gemini 3.1 ベース)— はこれらの地域で Mac、Windows、Chromebook Plus 向けに利用可能になりました。展開された機能には Gmail、Maps、Calendar、YouTube への Chrome からのアクセス、複数タブを跨いだ分析、Nano Banana 2 によるブラウザ内での画像変換などがあります。アップデートはヒンディー語、フランス語、スペイン語を含む 50 以上の言語を追加します。

🔗 Chrome がインド、ニュージーランド、カナダに拡大

--- ## AlphaEvolve : 5つのラムゼー数に対する新しい下限値

2026年3月11日 — Pushmeet Kohli(Google DeepMind)は、AlphaEvolveが組合せ最適化における5つの古典的ラムゼー数の新しい下限値を確立したと発表しました。これらは非常に困難な問題であり、Erdős自身がその難解さを言及しており、従来の最良結果は少なくとも十年以上前のものです。

AlphaEvolveは、歴史的に手作業で設計されていた特定アルゴリズムの代わりに、探索手順を自動的に発見するメタアルゴリズムとして機能します。この成果は、同技術が従来のGoogleのカーネル最適化以外の領域でも能力を発揮することを示しています。

🔗 Pushmeet Kohliのツイート


Gemini Embedding 2 : Google初のマルチモーダル埋め込み

2026年3月10日 — GoogleはGemini Embedding 2を発表しました。これは「our most capable and first fully multimodal embedding model」と説明されており、Google初のネイティブにマルチモーダル対応した埋め込みモデルで、Gemini APIとAI Studioを通じて開発者向けに提供されます。

🔗 @googleaidevsのツイート


GitHub Copilot : ターミナルからのコードレビューとJetBrainsにおける進展

2026年3月11日 — GitHub Copilotに関する注目すべき2つのアップデート。

GitHub CLI v2.88.0からのコードレビュー

ターミナルから直接Copilotにコードレビューを依頼できるようになりました。コマンド gh pr edit --add-reviewer @copilot(非対話モード)および gh pr create(対話モード)は、Copilotをチームメンバーと並列に統合します。レビュアー選択は動的検索を備え、大規模組織でのパフォーマンスを改善し、アクセシビリティの問題を修正します。Copilot code reviewを含むすべてのプランで利用可能 — GitHub CLI v2.88.0 へのアップデートが必要です。

🔗 GitHub CLIからのCode Review

JetBrains IDEs向けのエージェント機能強化

JetBrains用プラグインのアップデートでは、GA(一般提供)としてカスタムエージェント(custom agents)、サブエージェント、およびプランエージェント(plan agent)、さらにすべてのプランでの自動モデル選択が導入されました。パブリックプレビューでは、エージェントフック(userPromptSubmitted, preToolUse, postToolUse, errorOccurred)が hooks.json ファイルを .github/hooks/ に配置することで利用可能になり、AGENTS.md と CLAUDE.md ファイルのサポートも追加されます。

その他の改善点:MCPによる自動承認の設定、拡張推論モデル向けの思考パネル(thought panel)、コンテキストウィンドウ使用の指標、そしてメニューのEditモードの非推奨化などがあります。

🔗 JetBrains向け改善

Copilotウェブでのリポジトリ探索

パブリックプレビューとして、Copilotのウェブインターフェースから直接GitHubリポジトリのツリーを探索できるようになりました。選択したファイルはチャットの一時的な参照として自動的に追加され、恒久的にすることも可能です。

🔗 Copilotでのリポジトリ探索


Anthropic Sydney と Claude for Office

シドニー:アジア太平洋地域の4番目の拠点

2026年3月10日 — Anthropicは、シドニーにアジア太平洋地域で4番目(東京、ソウル、シンガポールに次ぐ)のオフィスを間もなく開設すると発表しました。オーストラリアは人口当たりのClaude.ai利用で世界4位、ニュージーランドは同指標で8位(Anthropic Economic Index)。新オフィスは当初、企業顧客、スタートアップ、研究に注力します。

🔗 シドニー:アジア太平洋4番目のオフィス

Claude for Excel と PowerPoint:コンテキスト共有とSkills Office

2026年3月11日 — Claude for Excel と Claude for PowerPoint のアドインに2つの重要なアップデートが入りました:両アプリ間でのコンテキスト共有(アナリストがExcelブックからデータを抽出し、単一の会話でPowerPointに利用できる)と、両アドインで使えるSkills(ワンクリックで再利用できるワークフロー)の導入です。

事前搭載されたSkillsは、最も一般的なユースケースをカバーします:数式監査、LBO/DCFモデル構築、競合環境のデッキ作成、新データでのプレゼン更新、投資銀行用デッキのレビューなど。アドインは、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry を通じて準拠したデプロイメントで利用可能になりました。対応プラットフォーム:MacとWindows、利用可能プランは有料プラン(Pro, Max, Team, Enterprise)。

🔗 Claude for Excel と PowerPoint


NVIDIA Nemotron 3 Super、ComfyUI と GTC 2026

2026年3月11日 — NVIDIAはGTC 2026に向けて活発に動いています。

Nemotron 3 Super は、前世代と比べエージェント向けAIで5倍のスループットを提供します。これはオープンソースの1200億パラメータ級MoE(Mixture of Experts)モデルで、高頻度推論負荷向けに最適化されています。

NVIDIAとComfyUI はGDC 2026で、ゲーム開発者やクリエイター向けにローカルでのAIビデオ生成を簡素化する統合を発表し、FLUXおよびLTX-Videoモデルのサポートを提供します。

NVIDIAのブログ「GTC 2026 Live Updates」にはサンノゼでの会議発表がまとめられており、Mistral AIもこの場でフロンティアモデルを紹介しています。

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live


短報

Runway Labs — RunwayはAlejandro Matamala Ortiz(共同創業者、イノベーションディレクター)主導の社内インキュベーターを立ち上げます。Runway Labsは、映画、ヘルスケア、教育、ゲーム、広告、不動産など多様な分野で、生成ビデオやGeneral World Models(世界の総合的シミュレーションモデル)向けの革新的なアプリケーションをプロトタイプ化します。採用募集中。

🔗 Introducing Runway Labs

Claude Code /btw — 新しいコマンド /btw により、タスク実行中に作業を中断せずにサイドチェーン会話(side chain conversations)を持つことが可能になりました。

🔗 @bchernyのツイート

NotebookLM Flashcards — クイズとフラッシュカードのアップデート:中断したところからの再開、成功/失敗したフラッシュカードの追跡、フラッシュカードの削除やシャッフルが可能になりました。

🔗 NotebookLMのツイート

Meta Canopy Height Maps v2 — MetaとWorld Resources InstituteはCHMv2を公開しました。これは世界の森林キャノピー高さマップの新バージョンです。Metaの自己監督型ビジョンモデルDINOv3により精度とカバレッジが向上しています。用途:気候移住、森林再生、都市計画。モデルはオープンソースで提供されます。

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5は2026年2月のローンチ以降Pro限定でしたが、現在はLiteユーザー(無償レベル)にも公開されました。

🔗 ZixuanLi_のツイート


何を意味するか

2026年3月11日は、2つの収束する長期的トレンドを象徴しています。

第一は「エージェント化のプラットフォーム化」です:OpenAI、Perplexity、GitHubが同日にシェルツール、サンドボックス、エージェントフック、コードレビューといった補完的なプリミティブを公開しました。エコシステムは、skills、コンテナ、サブエージェントといった再利用可能なブロックを中心に整備され、開発者がインフラを再発明せずに信頼性の高いエージェントを構築できるようになります。

第二は「カスタムシリコン競争」です:Metaが2年で4世代のMTIAを公開したことの細部は、汎用GPUからの独立を目指す明確な戦略を示しており、大規模推論向けに最適化されています。同じ論理がNVIDIAをしてGTC当日にNemotron 3 Superを発表させ、発表が相次いでいます。

Anthropic Instituteの創設は、より穏やかだが持続的な動きの一例です:能力が進展する中で、大手AI企業は広報的措置ではなく独立した研究努力として公共向けインパクトチームを組織化しています。


出典

この文書はフランス語(fr)版から日本語(ja)にgpt-5-miniモデルを使用して翻訳されました。翻訳プロセスの詳細については、https://gitlab.com/jls42/ai-powered-markdown-translator をご覧ください。