ai-powered-markdown-translatorfrからjaへ翻訳された記事(gpt-5.4-mini使用)。
2026年6月4日は、Anthropic Instituteによる歴史的な公開から始まる。AIはすでに自らの開発を加速させており、Anthropicのコードの80%以上がClaudeによって書かれ、生産性は8倍向上している。NVIDIAは同時に、エージェント向けの完全オープンソースな5500億パラメータのMoEモデル、Nemotron 3 Ultraを提供する。OpenAIは、ChatGPT向けの新しいメモリアーキテクチャであるDreaming v3を展開し、従来より5倍安価にした。GitHub Copilotはコンテキストが100万トークンの大台を突破する。そしてSunoは4億ドルの資金調達を発表し、評価額は54億ドルに達した。
Anthropic Institute — 「AIが自らを構築するとき」: 文書化された再帰的自己改善
6月4日 — The Anthropic Instituteは「When AI builds itself」を公開した。これは、AIが再帰的に自己改善する可能性に向けた進展を、社内データを伴って正式に文書化した初の資料である。共同執筆者のMarina FavaroとJack Clarkは、2026年5月の社内データを示し、Claudeが今やAnthropicのコードの大部分を書いていることを明らかにした。
| 指標 | 値(2026年5月) |
|---|---|
| Claudeが書いたAnthropicコードの比率 | 本番にマージされた行の80%以上 |
| コード/エンジニアの生産性向上 | 2024年比で2026年第2四半期に×8 |
| 進行中タスクの成功率 | 76%(6か月で50ポイント増) |
| コード最適化のスピードアップ(Mythos Preview) | Opus 4(2025年5月)の約3×に対し約52× |
| 人間より優れた研究判断 | 64%(Mythos Preview、Opus 4.5の51%に対し、2025年11月) |
| 社内調査 — 推定生産性向上 | Mythos Previewで×4(従業員130人、2026年3月) |
自律タスク継続時間の伸びは特に印象的だ。Claude Opus 3は2024年3月時点で約4分のタスクを扱い、Claude Sonnet 3.7は2025年3月に1時間30分、Claude Opus 4.6は2026年3月に12時間、そしてMythos Previewは2026年5月に16時間を超えた(METRベンチマークの測定上限)。継続時間はおよそ4か月ごとに倍増している。
具体的な成果もある。2026年4月、Claudeエージェントは未解決のAIセキュリティ問題を、仮説立案、テスト、反復を含めて端から端まで解決し、97%の性能向上を回収した。これは、人間の研究者2人が1週間かけて達成した23%を大きく上回り、累計800時間に相当する約18,000ドルの計算コストで実現された。
この記事は3つのシナリオを検討している。停滞(最も起こりにくいとされる)、人間の戦略的な指揮を伴う大規模な自動化、そしてモデルが人間の介入なしに後継モデルを構築する完全な再帰的自己改善である。記事は最後に、他の主要ラボの参加を条件とした、frontier AI開発の協調的かつ検証可能な停止を明確に呼びかけて締めくくっている。
“Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention.”
🇯🇵 社内データは、ClaudeがAI開発を加速させていることを示しています。これは、再帰的自己改善、あるいはより高性能な後継をAIが自律的に構築する道筋になり得ます。これは予想よりも速く進んでおり、その含意には一層の注意が必要です。 — @AnthropicAI
NVIDIA Nemotron 3 Ultra — 長時間稼働エージェント向けの550B MoEオープンソース
6月4日 — NVIDIAは、長時間稼働するAIエージェント(long-running agents)向けに特化して設計された、5500億パラメータのfrontierオープンソースモデル Nemotron 3 Ultra を提供する。この公開は、オープンソース重みの実質的な提供を意味する。Microsoft Buildでの2日の初回発表後、重みは現在HuggingFaceおよびOllama Cloud経由で利用可能だ。
| 特徴 | 値 |
|---|---|
| アーキテクチャ | Mamba-Transformer MoEハイブリッド |
| 総パラメータ数 | 5500億 |
| アクティブパラメータ | 550億(NVFP4) |
| 推論速度 | 同等のオープンソースfrontierモデルより5倍高速 |
| エージェントコスト削減 | -30% |
| HuggingFace重み | nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4 |
| クラウドアクセス | Ollama Cloud |
| 対応エージェントハーネス | OpenClaw、Hermes Agent(NousResearch)、LangChain |
Mamba-Transformer MoE のハイブリッドアーキテクチャにより、同じ時間予算の中でより多くの推論サイクルを実行できる。これが速度向上の理由だ。Nemotron 3 Ultraは、上級コーディング、深いリサーチ、計画、ツール利用、失敗からの復帰といった複雑なタスク向けに後学習されている。
NVIDIAは合成データと後学習レシピも公開しており、外部チームがプロセスを再現したり、さらに洗練したりできる。
“Today we’re shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models.”
🇯🇵 本日、私たちはNemotron 3 Ultraを提供します。5500億パラメータのfrontier級オープンソースMoEモデルで、長時間稼働エージェント向けに設計されています。推論は5倍高速で、他のオープンソースfrontierモデルと比べて複雑なエージェントタスクのコストを30%削減します。 — @NVIDIAAI
🔗 HuggingFace — Nemotron 3 Ultra
Dreaming v3 — ChatGPT向けの新しいメモリアーキテクチャ
6月4日 — OpenAIは、ChatGPT向けに全面的に再設計された自律メモリアーキテクチャ Dreaming v3 を展開する。このシステムは、従来の仕組みが抱えていた3つの限界、すなわち情報の鮮度、時間経過に伴う修正、Freeユーザーへのスケール拡張を解決する。
| 目的 | 説明 |
|---|---|
| コンテキストの継続性 | 情報を一度記憶し、将来の会話で再利用する |
| предпочт好みの尊重 | 個人的な制約(食事、タイムゾーンなど)を適用する |
| 時間的更新 | メモリを自動で修正する — 旅行後に、AIはあなたが戻ったことを把握する |
システムの履歴: saved memories は2024年4月に登場し(手動宣言)、その後2025年4月に「Dreaming v0」(バックグラウンドでの自動要約)が続いた。version 3はアーキテクチャ上自律的で、提供コストは約5分の1だ。このコスト削減こそが、Freeユーザーへの拡張を可能にした。
利用可能性: 本日より米国の Plus および Pro 加入者向け。その他の国および Free と Go ユーザーへの拡大は今後数週間以内に予定されている。
「Memory Summary」ページでは、ChatGPTがユーザーについて把握している内容の読みやすい要約を確認したり、情報を追加・修正したり、取り上げるトピックに関するルールを定義したりできる。
Suno シリーズD — 4億ドル調達、評価額54億ドル
6月3日 — Sunoは、シリーズDで4億ドルの資金調達を発表し、生成音楽プラットフォームの評価額は54億ドルに達した。今回のラウンドは Bond Capital が主導し、新規投資家(IVP、USV — Union Square Ventures、Forerunner Ventures)が参加、さらにMatrix VC、Lightspeed、Menlo Venturesによる継続支援も受けている。
評価額の推移は注目に値する。2024年5月に1億2,500万ドルを調達し、2025年11月には2億5,000万ドルで評価額24億5,000万ドル、そして現在は54億ドルへと、7か月で2倍以上になった。
Sunoは、世界でも最も資金力のあるAIクリエイティブ・プラットフォームの一つとして存在感を強めており、その使命は一貫している。つまり、技術的な制約なく、より多くの人が音楽を創る喜びを味わえるようにすることだ。
“We’re thrilled to announce Suno’s next chapter: a $400M Series D at a $5.4B valuation!”
🇯🇵 Sunoの次章を発表できることをとても嬉しく思います。評価額54億ドルで4億ドルのシリーズDです! — @suno
GitHub Copilot — 100万トークンのコンテキストウィンドウと設定可能な推論
6月4日 — GitHub Copilotは、本日からVS Code、Copilot CLI、GitHub Copilotアプリで利用できる2つの主要な新機能を追加する。
| 機能 | 利用可能性 | AIクレジットへの影響 |
|---|---|---|
| 100万トークンのコンテキストウィンドウ | VS Code、Copilot CLI、Copilotアプリ | 高い |
| 設定可能な推論レベル | VS Code、Copilot CLI、Copilotアプリ | 高い |
100万トークンのコンテキストウィンドウ により、より大きなコードベース、長文ドキュメント、複雑なマルチファイルプロジェクトでも、流れを見失わずに作業できる。これまでのコンテキスト制限では、開発者は作業を細切れにしたり、複雑なプロジェクトで問い合わせを単純化したりする必要があった。
設定可能な推論レベル により、速度と深さのバランスを調整し、最も複雑なアーキテクチャやデバッグの課題に対して「extended thinking」を有効化できる。GitHubは、最大設定は複雑なマルチファイル問題に限定することを推奨している。拡張コンテキストや高い推論を使うほど、1回のやり取りで消費するAIクレジットは増える。
他のCopilot面への拡張は、今後数週間以内に予定されている。
🔗 GitHub Changelog — Larger context windows
GitHub Copilot — 6月4日の更新
Visual StudioのCopilot — 2026年5月の更新
6月4日 — Visual Studio 2026のCopilot向け2026年5月アップデートは、計画立案と共同レビューを強化する。
- Agent Plan:リポジトリを読み取り専用で探索し、確認の質問を投げかけ、
.copilot/plans/plan-{titre}.mdに保存される詳細な計画を生成する。「Implement plan」ボタンでエージェントモードに切り替わる。 - Skillsパネル:ワークスペースとユーザープロファイルから検出されたすべてのエージェントスキルを一覧表示し、名前またはキーワードで検索できる。
- マルチファイル要約Diff:複数ファイルにまたがるCopilotの変更後、全体、ファイル単位、ブロック単位で変更を承認または取り消しできる「change summary」ビューを提供する。
- コンテキストウィンドウ使用量インジケーター:入力ボックス上部のアイコンと、「Summarize conversation」オプションにより空き容量を確保できる。
- コミットをコンテキストに追加:Git Historyのコミットを右クリックして、Copilot Chatのコンテキストとして添付できる。
🔗 GitHub Changelog — Visual Studio May update
github.com上のCopilot Chat — 強化されたPRコンテキスト(一般提供)
6月4日 — Copilot Chatは、public previewから、Copilotライセンス保有者全員向けの一般提供へ移行し、github.com上のdiffやpull request作業時の機能が強化される。
- コードとチャットを並べて表示:PRとチャットウィンドウを行き来することなく、会話をコードの隣で直接確認し、コメントやインライン変更を行える。
- コンテキストを自動読み込み:質問がdiffやPRに関する場合、関連コンテキストが自動的に注入されるため、抜粋をコピー&ペーストする必要がない。
- アクセス:各diffの上部にある「Ask about this diff」ボタン、またはコード行をハイライトしてドロップダウンメニューから利用できる。
🔗 GitHub Changelog — Copilot Chat PR context
Claude Code v2.1.162
6月3日 — Claude Codeのv2.1.162には、複数のUX改善と重要なエージェント修正が含まれる。
| 機能 | 説明 |
|---|---|
claude agents --json + waitingFor | 保留中セッションのブロック理由(例:権限プロンプト)がJSONに含まれるようになった |
/effort の永続化を確認 | 選択したレベルが新しいセッションのデフォルトになったとき、明示的に確認する |
| Autocomplete slash command | クリックでコマンドを実行せずにプロンプトへ挿入し、Enterで確定する |
| Remote Control footer pill | Remote Controlがセッションへのリンク付きで下部に固定ピルとして表示される |
| Windsurf → Devin Desktop の名称変更 | /ide、/terminal-setup、/scroll-speed で更新済み |
修正内容には、設定ディレクトリが読み取り専用のため起動時に静かに失敗する問題(Claude Codeはいまではメモリ内設定で起動する)、事前承認済みドメインに対するWebFetchルール未適用、バックスラッシュを含むWindows権限、さらに複数のエージェント修正(Ctrl+V画像、バックグラウンド移行時に失われるセッション、長時間セッションでのターミナル幅など)が含まれる。
ElevenLabs — Flows Agent とHasbroとの提携
ElevenCreative内のFlows Agent
6月4日 — ElevenLabsは、自社のElevenCreativeインターフェースで Flows Agent を立ち上げる。ユーザーが作りたいものを説明すると、エージェントが自動的に完全なパイプラインを構築する。プラットフォーム上で利用可能な音声、音楽、効果音ツールに、50以上の画像・動画モデルを接続し、単一の統合キャンバス上で処理する。
「assist」モードでは、エージェントが各有料操作の前に検証を求められるため、コスト管理を維持できる。これにより、マーケティングチームは、各ステップを手動で設定することなく、複数の製品、言語、フォーマットをまたいでモダリティを連鎖させ、クリエイティブなバリエーションを試せる。
ElevenLabs × Hasbro — Iconic Marketplaceでのライセンス付きキャラクターボイス
6月3日 — ElevenLabsは Hasbro と提携し、Iconic Marketplace を通じて公式キャラクターボイス(My Little Pony、Transformers、G.I. Joe)を提供する。これらの音声はHasbroおよび元の音声タレントと協力して構築され、開発者、企業、アプリ制作者向けに明確に定義された利用権が付与される。この提供は、AIの創造性とブランドの知的財産権保護を両立させることを目指している。
GPT-Rosalind — ライフサイエンス向けの新機能
6月3日 — OpenAIは、enterprise規模のライフサイエンス研究向け専用モデル GPT-Rosalind の大規模アップデートを発表する。このモデルは、GPT-5.5のエージェント機能と、医薬化学およびゲノミクスで強化された知能を組み合わせている。
| ベンチマーク | 分野 | GPT-Rosalindスコア | GPT-5.5スコア | トークン削減 |
|---|---|---|---|---|
| LifeSciBench | ライフサイエンス(6分野) | 最良 | — | — |
| MedChemBench | 医薬化学 | 27,5% | 25,1% | -7,2% |
| GeneBench | ゲノミクス | 21,6% | 20,4% | -31% |
| LabWorkBench | wet labプロトコル | 63,2% | 55,8% | -5,3% |
2つの新しいプラグインが、すべてのCodexユーザーに提供されるようになった。Life Sciences Research plugin(出典付き証拠の取得)と Life Sciences NGS Analysis plugin(scRNA-seq、bulk RNA-seqのバイオインフォマティクス・ワークフロー)である。Novo Nordisk が最初に発表されたパートナーだ。アクセスは、適格な組織(正当な科学研究、堅牢なガバナンス)に対してグローバルに拡大される。
Perplexity が米国SBAとともに Main Street AI Accelerator を開始
6月4日 — Perplexity は米国中小企業庁(SBA)と提携し、Main Street AI Accelerator を開始します。このプログラムでは、$25 million 分の Perplexity Computer クレジットを提供します。米国250周年にちなみ、最大100,000社の対象企業にそれぞれ $250 分のクレジットが配布されます。
対象となるのは、SBA の 7(a)、504、およびマイクロローンの受給企業です。応募はまだ始まっておらず、専用ページで待機リストに登録できます。この取り組みは、先週発表された Computer の 400+ 件の enterprise 統合(Intuit QuickBooks、Vercel、Shopify、Canva)に続き、Computer を米国の地域経済に広げるという Perplexity の戦略の一環です。
Cohere が NATO のエージェント型AIチャレンジで1位を獲得
6月4日 — Cohere は NATO Agentic AI for Cognitive Warfare Innovation Challenge で 第1位 を獲得しました。最終順位は以下のとおりです。
- Cohere(1位)
- OpenMinds(2位)
- Ipsos & Thoughtworks(3位、同点)
この大会は、民主主義国家が情報脅威を理解し、予測し、対応するのを支援するうえで、エージェント型AIの役割がますます大きくなっていることを浮き彫りにしています。Cohere にとって、この NATO からの評価は、防衛および政府分野向けの主権AIにおける同社の立ち位置を裏づけるものです。これは、2026年4月の Aleph Alpha との大西洋横断的な統合以来、同社の主要な軸となっています。
Pika — iOS で AI エージェント付き Group Chat
6月4日 — Pika は、自社アプリ内で AI エージェントを統合した初の Group Chat を開始します。ユーザーは連絡先をグループチャットに招待し、そこに Pika Agent が創造的な会話に参加します。たとえば、スマートフォンの設定支援、グループでのミーム作成、短尺動画の共同制作などです。現在 iOS で利用可能で、https://pika.me. から入手できます。
ブリーフ
-
Anthropic の記事 — Claude を使ったセルフサービス分析 — Anthropic チームが、Claude を使ってセルフサービス型データ分析エージェントを構築するためのベストプラクティスを公開しました。スキル(skills)、データ基盤、評価です。🔗 Claude Blog
-
Google Antigravity v2.0.11 — Gemini 搭載 IDE の安定性パッチです。修正は2件(起動時の停止と “Open IDE” ボタン)で、新機能はありません。🔗 Antigravity Changelog
-
GitHub Enterprise Teams GA — Enterprise Teams が GitHub Enterprise Cloud で一般提供になりました。企業レベルで一度定義したグループを、すべての組織に割り当て可能で、SCIM、GitHub Apps、完全な監査に対応します。最大 2,500 チーム、チームあたり 5,000 メンバーまで対応します。🔗 GitHub Changelog
-
Genspark — Microsoft Build で Agent365 のローンチパートナー — 共同創業者の Ray Zhong が Microsoft Build の舞台に登壇し、世界的な戦略パートナー兼 Agent365 のローンチパートナーとして、既存の Microsoft enterprise インフラにエージェント型AIを組み込む役割を担いました。🔗 Genspark のツイート
-
Cohere がカナダの国家AI戦略を支持 — CEO の Aidan Gomez は Cohere のカナダに根ざした立場を改めて示し、カナダの新しい国家AI戦略を、技術主権の確立と次世代AIを国内で構築するための重要な一歩として称賛しました。🔗 Cohere のツイート
これが意味すること
AI の自己改善は、理論上のシナリオから、測定された内部データへと移行しています。 Anthropic Institute の公開は憶測ではありません。80%超のコード、8倍の生産性、オープンタスクでの76%成功率という具体的な数値を伴う現場レポートです。4か月ごとに2倍になる自律タスクの継続時間は、進行中のダイナミクスを示す最も明確なシグナルです。AI セキュリティの界隈で将来のリスクとして議論されていたことが、いまや現在の現実として記録されています。Anthropic が最初の提唱者となった協調的な一時停止の呼びかけは、商業競争と規制上の慎重さのあいだにある緊張を示しています。
フロンティア級のオープンソースは、次元が変わっています。 5500億パラメータの Nemotron 3 Ultra は、完全なオープンソース、ダウンロード可能な重み、合成データ、公開されたレシピを備え、フロンティアモデルにおける「オープンソース」の意味を再定義します。5×高速な推論速度と、エージェント型タスクでの30%のコスト削減は、些細なものではありません。大手のプロプライエタリクラウドの外で、複雑なエージェントを実行することを現実的にします。自律エージェントを構築するチームにとって、これは新しいインフラの登場です。
開発者向けツールは、長時間動作するエージェントを中心にまとまりつつあります。 1M tokens のコンテキストを持つ GitHub Copilot、JSON agents に waitingFor を備えた Claude Code v2.1.162、マルチモーダルなパイプラインを構築する ElevenLabs の Flows Agent —— これら3つの発表は、同じパラダイムを共有しています。エージェントは長いコンテキストを扱い、自身の状態を他システムに伝え、人手を介さずに複数のツールをオーケストレーションしなければならない、ということです。Copilot の「設定可能な推論」と Claude Code の永続的な /effort は、同じ問いに答えています。つまり、ユーザーはタスクの複雑さに応じて、思考の深さをどのように調整できるのか、という問いです。
クリエイティブAI経済は、象徴的な節目を迎えています。 Suno の評価額が7か月で $5.4 billion に達し、価値が倍増したことは、投資家が一般向けスケールの生成音楽制作プラットフォームに賭けていることを示しています。近年の動画分野での資金調達(Runway、Pika)と合わせると、AI クリエイション分野は今や、従来の大手クリエイティブソフトウェアベンダーに匹敵する時価総額を持つに至っています。ElevenLabs の Iconic Marketplace に Hasbro が参加したことは、知的財産権の保有者がどのように適応しているかを示しています。AI を止めるのではなく、ライセンスの下で収益化しているのです。
出典
- Anthropic Institute — AI が自らを構築する時
- @AnthropicAI のツイート — 自己改善
- NVIDIA Nemotron 3 Ultra — @NVIDIAAI
- HuggingFace — Nemotron 3 Ultra
- OpenAI — Dreaming v3(ChatGPT の記憶)
- Suno — Series D $400M
- Suno Blog — 次の章
- GitHub Changelog — Copilot 1M context + 推論
- GitHub Changelog — Copilot Visual Studio May update
- GitHub Changelog — Copilot Chat PR context GA
- Claude Code v2.1.162 — GitHub Releases
- ElevenLabs Flows Agent — @ElevenLabs
- ElevenLabs Iconic Marketplace
- ElevenLabs × Hasbro — @ElevenLabs
- OpenAI — GPT-Rosalind 新機能
- Perplexity — Main Street AI Accelerator
- Main Street AI Accelerator — 専用ページ
- Cohere — NATO チャレンジ1位
- Pika — Group Chat iOS
- Anthropic blog — セルフサービス分析
- Google Antigravity v2.0.11 changelog
- GitHub Enterprise Teams GA
- Genspark — Agent365 Microsoft Build
- Cohere — カナダの国家AI戦略