検索

NotebookLMがエージェント化、Kimi Workが300のローカルエージェントを起動、ハーバードによるAIエージェント研究

NotebookLMがエージェント化、Kimi Workが300のローカルエージェントを起動、ハーバードによるAIエージェント研究

ai-powered-markdown-translator

fr から ja への翻訳済み記事、gpt-5.4-mini で。

GitHub でプロジェクトを見る ↗

2026年6月6日〜8日は、自律エージェントの台頭が主役だった。NotebookLMはエージェントモードに移行し、KimiはWork(300のローカルエージェント群)とCodeの大幅アップデートを同時に発表、そしてPerplexityはハーバードとともに、企業環境におけるエージェントの初の大規模実証研究を公開した。結果は、時間87%減、コスト94%減だった。並行して、NVIDIAは韓国でLG GroupとDoosanの2件の提携を結び、GoogleはAI Plusサブスクリプションの価格を引き下げ、ElevenLabsは英国政府との合意を通じて英国に進出した。


NotebookLMがエージェント化 — ウェブで世界展開

6月8日 — Googleは、AI支援付きのメモ作成・検索ツールであるNotebookLMの大規模アップデートを発表した。アプリには現在、チャット内でのエージェント機能(agentic capabilities、より高度な推論(more advanced reasoning)、そして一連の新しい最適化が追加されている。展開は6月8日よりウェブ版で世界同時に始まる。

Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning, and a suite of new optimizations.

🇯🇵 より強力になったNotebookLMをご紹介します — 大規模アップデートにより、チャット内のエージェント機能、より高度な推論、そして一連の新しい最適化が追加されました。@NotebookLM のX投稿

この発表は、6月5日の謎めいたツイート — “Ok, it’s probably about time we changed the game. Stay tuned 👀” — の時点で予告されていた。これは415,000ビューと3,766いいねを集めていた。展開はまずGoogle AI Ultra加入者とGoogle Workspace顧客から始まり、その後ほかのウェブ利用者へ段階的に広がる。

この進化により、NotebookLMは単なるスマートなメモツールから、会話の中でより自律的にタスクを実行できる本格的な自律検索エージェントへと変わる。方向性は、GoogleがI/O 2026で発表した「agentic era」戦略と一致している。つまり、Googleのアプリは今や会話支援だけでなく、自律的なアクションループを組み込むようになっている。

項目以前以後
動作モード会話型アシスタンスチャット内のエージェント機能
推論標準高度な推論
利用可能性ウェブ(既存)6月8日からウェブで世界展開

🔗 @NotebookLM の発表


Kimi Work — 300の並列ローカルエージェントを備えたデスクトップエージェント

6月8日 — Moonshot AIは、macOS(Apple Silicon)とWindows上でローカル動作するデスクトップ向けネイティブAIエージェントKimi Workを発表した。最も特徴的なのは、最大300のエージェントをローカルマシン上で並列実行できるエージェント群(agent swarm)アーキテクチャで、クラウドに常時依存する必要がない点だ。

Meet Kimi Work - a local AI agent on your desktop that does the work for you. Native agent swarm: Up to 300 AI agents running in parallel on your local machine.

🇯🇵 Kimi Workをご覧ください — あなたのために働く、コンピュータ上のローカルAIエージェントです。ネイティブなエージェント群:あなたのマシン上で最大300のAIエージェントを並列実行できます。@Kimi_Moonshot のX投稿

主な機能:

機能説明
ネイティブなエージェント群ローカルマシン上で最大300のAIエージェントを並列実行
ブラウザ利用WebBridge拡張で、閲覧、検索、クリック、Webタスク実行が可能
統合金融データ複雑なAPI設定なしでYahoo FinanceとWorld Bankにネイティブアクセス
永続メモリ好み、過去の判断、ユーザーコンテキストの履歴
対応プラットフォームmacOS(Apple Silicon)とWindows

Kimi Workは現在 kimi.com/products/kimi-work で利用可能。


Perplexity × ハーバード — AIエージェントが作業時間を87%削減

6月8日 — Perplexityは、Harvard Business Schoolの研究者と共同で、3か月(2026年2月〜5月)にわたって実施した実証研究を公開した。これは、会話型アシスタント(Search)と自律型生産性エージェント(Computer)を、実運用条件下で何十万ものアクティブユーザーに対して初めて大規模比較したものだ。

結果は顕著だった。ComputerはSearch単体よりも87%少ない時間94%少ないコストでタスクを完了した。セッションあたりの自律的な機械実行は33秒から26分へ増加し、48倍となった。

指標Search + 人間Computer + 人間効果
タスクあたり平均時間269分36分−87 %
推定コスト(基準)−94 %
セッションあたりの機械実行33秒26分×48
「作成」レベルのタスク(Bloom)26 %50 %
主たる職務外の作業50 %59 %
1回の要求あたりの知識分野数1,742,40+38 %

Computerの優位性は、分析された18の全分野で確認され、時間削減は79〜92%、コスト削減は87〜96%に及んだ。この研究は、自律エージェントが既存のタスクを速くするだけでなく、実行される仕事の性質そのものを変えることを示している。Computerの利用者は実行を機械に委ね、自分の主な専門分野の外にあるスキルを必要とするタスクに取り組んでいる。

🔗 完全な研究 — research.perplexity.ai · 🔗 @perplexity_ai の発表


Claude Code 1年目 — Boris ChernyとCat Wuによる動画回顧

6月8日 — Anthropicは、Claude Codeの一般提供開始1周年を記念するYouTube動画を公開した。Boris Cherny(@bcherny)とCat Wu(@_catwu)が、プロジェクトの歴史を振り返る。最初の社内デモはSlackでたった2件の反応しか得られなかったという。1年後、Anthropicのエンジニアは2021〜2022年と比べて、四半期あたり平均で8倍多くのコードを出荷している。

動画では4つのテーマが扱われる。planモードではなくautoモードを選んだ理由、検証のベストプラクティス(verification best practices)、自動化の仕組みとしてのルーチンとループ(routines and loops)、そしてクラウド上のClaude Codeを使ったスマートフォンからのコーディングだ。

🔗 YouTube動画 — Claude Code 1周年


Anthropic Science Blog — 生物学におけるエージェントのための基盤構築

6月8日 — AnthropicはScience Blog(“Paving the way for agents in biology”)の投稿を公開し、中心的な問いを提示した。なぜAIエージェントは、生命科学よりもソフトウェア開発の方でずっと速く進歩したのか。その答えは、生物学データベースがエージェントではなく人間向けに設計されているからだ。つまり、それらは*「自動車以前に建てられた都市」*のようなものなのだ。

同チームは、ウイルスデータを決定論的に取得するレイヤーである gget virus と、ウイルスデータ上でエージェントを評価するためのベンチマークVirBenchを開発した。主要な結果として、gget virus を使うと、GPT-5.5は99.7%の精度に達し、Claude Sonnet 4は90%を超えた。モデル選択の重要性は二次的なものになる。

🔗 Anthropic Science Blog · 🔗 @AnthropicAI の発表


Google AI Plus — $7.99 → $4.99/月、ストレージ200GB → 400GB

6月8日 — GoogleはAI Plusサブスクリプションの価格を**$7.99から$4.99/月へ**(または現地通貨換算)引き下げ、37.5%の値下げとした。同時に、含まれるストレージは200GBから400GBへ倍増した。この発表はGemini AIサブスクリプション製品責任者のVikas Kansalによるもので、@GeminiApp と @NewsFromGoogle によって正式に再掲された。

項目以前以後
月額料金$7.99/月$4.99/月
含まれるストレージ200 GB400 GB

🔗 @vikaskansalHQ の発表


Gemini Live — リアルタイム画像生成と編集

6月5日 — Googleは、音声とビジュアルの会話中に、Gemini Live内で直接画像の生成と編集ができるようになったと発表した。この機能により、室内装飾(room decor)、創造的な可視化、あるいはLiveインターフェースを離れずに会話の流れの中で画像を修正するといった、リアルタイムの視覚的イテレーションが可能になる。この発表はX上で560万回の閲覧、1,982件のいいね、295件のリポストを記録し、Gemini領域で今週最も反応の大きかったツイートの1つとなった。

🔗 @GeminiApp の発表 · 🔗 Gemini Live — 機能概要


NVIDIAが韓国でAI Factoryを構築

NVIDIA + LG Group — ロボティクス、EXAONE、データセンター

6月7日 — NVIDIAとLG Groupは、4つの分野をカバーする共同AI Factoryの構築を発表した。ロボティクス(CLoiDロボット、Isaac Sim、Isaac Lab)、自動運転(DRIVE Hyperion、DRIVE AGX)、データセンター技術(800V DCソリューション向けのLG Energy Solution、NVIDIA DSXに整合した大規模AIデータセンター向けのLG Uplus)、そして韓国の主権AIだ。LG AI Researchは、NVIDIA Blackwell GPUとNeMoフレームワーク、さらにNemotronデータセットを用いて、韓国の主権AIモデルEXAONEを開発し、企業向けチャットボットChatEXAONEを通じて展開した。さらにLG CNSは、NVIDIAの技術を産業プラットフォームPhysicalWorksに統合している。

🔗 NVIDIAブログ — LG Group

NVIDIA + Doosan Group — フィジカルAIとデータセンター電源

6月7日 — NVIDIAとDoosan Groupは、4つの事業体にまたがって協業を拡大した。Doosan Robotics(Isaac Sim、Isaac Lab、Cosmos、Newton物理エンジン、NVIDIA Jetson Thorを統合したAgentic Robot OS — 積み下ろし、研磨、両腕ロボット、ヒューマノイドのユースケースを想定)、Doosan Bobcat(自律型建設・搬送機器)、Doosan Enerbility(ガスタービン、蒸気タービン、小型モジュール炉SMR、および高性能AIデータセンターの電源供給向け水素燃料電池)、そしてDoosan Corporation Electro-Materials(NVIDIA MGXエコシステム内のAIサーバー向けプリント基板用高性能銅張積層板CCL)である。

🔗 NVIDIAブログ — Doosan Group


ElevenLabsが英国政府と契約を結び、ロンドンの人員を倍増

6月8日 — ElevenLabsは、英国政府のDSIT(科学・イノベーション・技術省)と覚書(Memorandum of Understanding)を締結し、英国の公共サービスに音声AIを導入する。重点は3つ。アクセシビリティ(弱視者、低識字率層、高齢者、ウェールズ語話者コミュニティ)、AI安全性(英国AI Safety Instituteとの提携)、そして人材育成だ。

同時に、ElevenLabsは今年、英国の人員を200人に倍増させ、ロンドンに3倍の広さを持つ新本社へ移転する。同社はすでにRevolut(30言語で400万人の顧客向け音声エージェント)、Deliveroo、Trainlineと協業している。

🔗 ElevenLabsブログ


Manus — 複数のGmailとGoogle Calendarアカウント接続

6月8日 — Manus(現在はMetaに統合されている)は、複数のGmailおよびGoogle Calendarアカウントを同時にサポートすると発表した。ユーザーは、仕事用、個人用、顧客用、チーム用の受信箱を1つのワークフローに接続し、メールやカレンダーを伴う各タスクごとに、Manusがどのアカウントから動作するかを選べる。これによりエージェントは複数の予定表を並行して調整し、空き時間を見つけ、適切なアカウントから送信し、複雑な設定なしで定型的な複数アカウント作業を自動化できる。どのアカウントを使うかをプロンプトで指定するだけでよい。

🔗 Manusブログ


ASUS ProArtノートPC上でローカル動作する FLUX.2 [klein]

6月4日 — Black Forest Labsは、同社で最も高速な画像生成モデルFLUX.2 [klein](40億パラメータ)が、RTX GPU搭載のProArtノートPC向けASUS MuseTreeアプリにあらかじめ統合されていると発表した。目標は、業務用アプリが動作中でも、8GBのVRAMで5秒未満で画像を生成することだ。インターネット接続もAPI呼び出しも不要で、モデルは完全にローカルで動作する。

🔗 Black Forest Labsブログ


Kimi Code — 大規模アップデート(CLI、動画、プラグイン、ACP)

6月8日 — Moonshot AIは、Kimi K2.6を搭載したオープンソースのコードエージェントKimi Codeの重要なアップデートを公開した。重点はアクセシビリティと拡張性にある。1行でのCLIインストール(zero setup, fast startup)、コード文脈としての動画インポート(reference-to-LUTlong-video-to-shortscreen-recording-to-code)、金融プラグイン(株価、レポート)と学術プラグイン(研究論文)、エージェント間通信のためのACPプロトコル、JetBrains・Zed・その他IDEのサポート、そしてhooksによるツールのカスタマイズだ。コミュニティからの貢献(issue、プラグイン、PR)も奨励されている。

🔗 @KimiDevs の発表 · 🔗 Kimi Code


Grok — Design Arenaで1位、Notion AIに統合

Grok Imagine Video 1.5 Preview — Image-to-Videoで1位

6月8日 — xAIのGrok Imagine Video 1.5 Previewは、Eloスコア1357でDesign ArenaのImage-to-Videoランキング首位となった。このモデルは、生成速度とコストを両立する新たな性能水準(Pareto frontiers)を打ち立てており、平均生成時間は41.2秒、480p解像度での価格は1画像あたり$0.011秒あたり$0.08だ。このランキングは、6月3日にAPIでリリースされたGrok Imagine 1.5 Previewを土台に、独立ベンチマーク上で競合ソリューションに対するモデルの競争力を裏付けている。

🔗 @grok の発表

Notion AI に Grok 4.3 + Grok Build 0.1

6月2日 — xAIのGrok 4.3とGrok Build 0.1が、情報管理プラットフォームNotionに組み込まれたAIレイヤーであるNotion AIで利用可能になった。この統合により、NotionユーザーはGrokモデルを活用した高度な検索、文章作成支援、データベース管理機能を利用できる。これは、6月3日に発表されたVapiへの統合に続く、1週間足らずで2件目のGrokの主要な生産性ツール統合であり、2026年6月におけるxAIの多プラットフォーム展開戦略を示している。

🔗 @grok の発表


OpenAI Economic Research Exchange — 公募受付中

6月8日 — OpenAIは、AIの経済的影響に関する外部の学術研究を資金支援するための体系的プログラムOpenAI Economic Research Exchangeを開始した。選ばれた研究者は、OpenAI Economic Researchチームと協力し、OpenAIのツールとデータにアクセスできる。応募締切は2026年7月5日、選考結果の通知は2026年7月31日

パラメータ詳細
応募締切2026年7月5日
選考結果通知2026年7月31日
対象分野労働経済、生産性、教育、不平等、起業
連絡先econresearch@openai.com

🔗 OpenAI Economic Research Exchange


ブリーフ

  • Boris Cherny が Claude Opus を自律運用させるための5つの助言 — auto mode、動的ワークフロー、/loop、クラウド上の Claude Code、そしてエンドツーエンドの検証(Chrome 拡張、MCP 経由の iOS/Android シミュレータ、完全なサーバー起動)。🔗 @bcherny のツイート
  • Runway — Aleph 2.0 によるアスペクト比の自動リフォーマット — 既存の動画を取り込み、ターゲット形式(例: 16:9 → 9:16)を選ぶと、モデル Aleph 2.0 がまるでその形式で撮影されたかのようにシーンを補完します。app.runwayml.com で利用可能。🔗 @runwayml のツイート
  • Kling AI — 2周年:ユーザー数1億人 — ユーザー数1億人、企業顧客ほぼ5万社、1年で26回のモデル反復。🔗 @Kling_ai のツイート
  • Alibaba Wan Character X — ユニークな顔、カスタムアバター、独自のビジュアルアイデンティティを瞬時に生成。create.wan.video/lab/playground/character でテスト利用可能。🔗 @Alibaba_Wan のツイート
  • Perplexity Billion Dollar Build — 6月9日にライブ決勝 — 1,500チームが7週間の競争に参加。上位8チームが、Lewis Hamilton(F1 7回王者)、Arav Srinivas(Perplexity CEO)、Rich Miner(Android共同創業者)を審査員に迎えてライブでプレゼンします。🔗 @perplexity_ai のツイート

それが意味すること

自律エージェントは概念段階から実証的測定の段階へ移行している。 Perplexity × Harvard の研究は方法論上の転換点です。一般汎用エージェント(Computer)と会話型アシスタント(Search)を、3か月にわたり数十万の実ユーザー上で初めて比較しました。-87% の時間、-94% のコスト、×48 のマシン実行という数値は、研究室で組み立てたベンチマークではなく、実際の利用条件下での測定です。NotebookLM がエージェントモードへ移行し、Kimi Work がローカルで300エージェントを並列展開する結果と合わせると、2026年6月8日は、エージェント的な約束が大規模に可視化される週となります。

産業用AI主権が韓国で組織化されている。 NVIDIA との2つの提携――LG Group および Doosan Group との提携――は、単なる商業契約ではありません。エネルギー生成(SMR と水素燃料電池を手がける Doosan Enerbility)から、回路基板用材料(Doosan Electro-Materials)、産業用ロボット(Doosan Robotics)、一般消費者向け家電(LG CLoiD)までを含む、完全なフィジカルAI産業のサプライチェーンを構築しています。LG AI Research が Blackwell 上で開発した EXAONE モデルは、韓国が NVIDIA インフラに連動した主権AIを構築していることを裏付けます。これはフランスの Mistral に似た軌道ですが、より大規模な産業規模です。

音声AIは公共部門で制度化されつつある。 ElevenLabs と英国政府(DSIT)との合意は、新しい段階を示しています。政府はもはや観察や規制にとどまらず、民間事業者と覚書(MOU)を締結し、アクセスビリティ、セキュリティ、ウェールズ語のような少数言語といった、機微な公共サービスに音声AIを導入しています。すでにウクライナ、チェコ共和国、ギリシャで ElevenLabs for Government を通じて進行中のプログラムと組み合わさることで、試験導入を超えて本格展開へ移行する公共向け音声AI市場の姿が見えてきます。

マルチエージェント開発者向けツールが標準化している。 Moonshot AI は1日で、Kimi Work(ローカルで300エージェントを並列実行、WebBridge、永続メモリ)と Kimi Code の刷新(CLI のワンライナー、動画をコンテキストとして利用、エージェント間 ACP プロトコル、JetBrains/Zed)を同時に公開しました。この、デスクトップエージェント+コードエージェントという二本立ての連携発表は、垂直統合戦略を反映しています。同じ提供元がデスクトップ自動化と開発自動化の両方を提供するのです。これは Claude Code と Codex CLI への直接的な応答ですが、既定でローカル実行という重要な違いがあります。


ソース