NotebookLM 变得更具代理性，Kimi Work 发布 300 个本地代理，哈佛关于 AI 代理的研究

2026年6月6日至8日这一周由自主代理的兴起所主导：NotebookLM 切换到代理模式，Kimi 同时发布 Work（300 个本地代理的集群）以及 Code 的重大更新，Perplexity 还与哈佛联合发布了首个关于企业中代理的重大实证研究——时间减少 87%，成本降低 94%。与此同时，NVIDIA 在韩国签下两项合作（LG Group 和 Doosan），Google 下调了其 AI Plus 订阅价格，ElevenLabs 也通过政府协议在英国落地。

NotebookLM 变得更具代理性 — 在网页端全球部署

6月8日 — Google 为其 AI 辅助笔记和研究工具 NotebookLM 发布了一项重大更新。该应用现已在聊天中具备代理能力（agentic capabilities）、更先进的推理（more advanced reasoning），以及一系列新的优化。从 6 月 8 日起，网页版将开始全球部署。

Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning, and a suite of new optimizations.

🇨🇳 更强大的 NotebookLM 来了——大规模更新为聊天带来代理能力、更先进的推理，以及一系列新的优化。 — @NotebookLM 在 X 上

这项公告早在 6 月 5 日那条神秘推文之后就备受期待——“Ok, it’s probably about time we changed the game. Stay tuned 👀“——该推文已获得 41.5 万次浏览和 3,766 个赞。部署首先面向 Google AI Ultra 订阅用户和 Google Workspace 客户，然后再逐步扩展到其他网页用户。

这一演进使 NotebookLM 从智能笔记工具转变为真正的自主研究代理，能够在对话中更独立地执行任务。该方向与 Google 在 I/O 2026 上宣布的“agentic era”战略一致：Google 的应用如今集成了自主行动循环，而不仅仅是对话式辅助。

方面	之前	之后
工作方式	对话式辅助	聊天中的代理能力
推理	标准	先进推理
可用性	网页端（已有）	自 6 月 8 日起网页端全球部署

🔗 @NotebookLM 公告

Kimi Work — 配备 300 个并行代理的本地桌面代理

6月8日 — Moonshot AI 发布 Kimi Work，这是一个原生桌面 AI 代理，能够在 macOS（Apple Silicon）和 Windows 上本地运行。其最具特色的功能是一个代理集群（agent swarm）架构，可在本地机器上并行运行多达 300 个代理，无需系统性地依赖云端。

Meet Kimi Work - a local AI agent on your desktop that does the work for you. Native agent swarm: Up to 300 AI agents running in parallel on your local machine.

🇨🇳 了解 Kimi Work——你电脑上的本地 AI 代理，为你工作。原生代理集群：你的机器上可并行运行多达 300 个 AI 代理。 — @Kimi_Moonshot 在 X 上

核心功能：

功能	描述
原生代理集群	在本地机器上可并行运行多达 300 个 AI 代理
浏览器使用	通过 WebBridge 扩展来浏览、搜索、点击并完成网页任务
集成金融数据	原生接入 Yahoo Finance 和 World Bank，无需复杂的 API 配置
持久记忆	记录偏好、过往决策和用户上下文历史
平台	macOS（Apple Silicon）和 Windows

Kimi Work 现已在 kimi.com/products/kimi-work 上线。

Perplexity × 哈佛 — AI 代理将工作时间减少 87%

6月8日 — Perplexity 发布了一项与哈佛商学院研究人员共同开展、历时三个月（2026年2月—5月）的实证研究。这是首次在真实环境中，对会话式助手（Search）与自主生产力代理（Computer）进行的大规模比较，覆盖了数十万活跃用户。

结果令人瞩目：Computer 完成任务所需时间比仅使用 Search 少 87%，成本 低 94%。每次会话的自主机器执行时间从 33 秒提升到 26 分钟——相当于 ×48。

指标	Search + 人工	Computer + 人工	收益
平均每项任务耗时	269 分钟	36 分钟	−87%
估算成本	（基准）		−94%
每次会话的机器执行时间	33 秒	26 分钟	×48
“创建”级别任务（Bloom）	26%	50%
非主要职业领域工作	50%	59%
每次查询涉及的知识领域	1.74	2.40	+38%

Computer 的优势在所分析的全部 18 个领域中都得到了验证，节省时间达 79% 至 92%，节省成本达 87% 至 96%。研究表明，自主代理不仅让现有任务更快，也改变了所执行工作的本质。Computer 的用户将执行交给机器，从而能够处理超出其主要领域能力范围的任务。

🔗 完整研究 — research.perplexity.ai · 🔗 @perplexity_ai 公告

Claude Code 一周年 — 与 Boris Cherny 和 Cat Wu 的视频回顾

6月8日 — Anthropic 发布了一段 YouTube 视频，庆祝 Claude Code 正式发布一周年。Boris Cherny（@bcherny）和 Cat Wu（@_catwu）回顾了项目历史：最初的内部演示只收到了两条 Slack 反应。一年后，Anthropic 工程师平均每个季度提交的代码量是 2021-2022 年的 8 倍。

视频涵盖四个主题：选择 auto 模式而非 plan 模式、验证最佳实践（verification best practices）、例程和循环（routines and loops）作为自动化机制，以及借助云端的 Claude Code 从手机上编码。

🔗 YouTube 视频 — Claude Code 一周年

Anthropic Science Blog — 为生物学中的代理构建基础设施

6月8日 — Anthropic 发布了一篇 Science Blog（“Paving the way for agents in biology”）文章，提出一个核心问题：为什么 AI 代理在软件开发上的进展远快于生物学？答案是：生物数据库是为人类设计的，而不是为代理设计的——它们更像是*“在汽车出现之前建造的城市”*。

团队开发了 gget virus，这是一个用于病毒数据检索的确定性层，并开发了用于评估病毒数据上代理表现的基准 VirBench。关键结果：借助 gget virus，GPT-5.5 达到 99.7% 的准确率，Claude Sonnet 4 超过 90%——模型选择变得次要。

🔗 Anthropic Science Blog · 🔗 @AnthropicAI 公告

Google AI Plus — $7.99 → $4.99/月，200 GB → 400 GB 存储

6月8日 — Google 将其 AI Plus 订阅价格从 $7.99/月降至 $4.99/月（或当地等值价格），降幅为 37.5%。与此同时，包含的存储空间从 200 GB 翻倍至 400 GB。该公告由 Gemini AI 订阅产品负责人 Vikas Kansal 发布，并被 @GeminiApp 和 @NewsFromGoogle 正式转发。

方面	之前	之后
月费	$7.99/月	$4.99/月
包含存储	200 GB	400 GB

🔗 @vikaskansalHQ 公告

Gemini Live — 实时创建和编辑图像

6月5日 — Google 宣布可直接在 Gemini Live 中进行图像创建和编辑，并可在语音与视觉对话过程中使用。该功能支持实时视觉迭代：室内装饰（room decor）、创意可视化，或在不离开 Live 界面的情况下边对话边修图。该公告在 X 上获得了 560 万次浏览、1,982 个赞和 295 次转发——是本周 Gemini 领域最受关注的推文之一。

🔗 @GeminiApp 公告 · 🔗 Gemini Live — 功能概览

NVIDIA 在韩国编织其 AI 工厂

NVIDIA + LG Group — 机器人、EXAONE 与数据中心

6月7日 — NVIDIA 与 LG Group 宣布共建一座覆盖四个领域的 AI Factory：机器人（CLoiD 机器人、Isaac Sim 和 Isaac Lab）、自动驾驶（DRIVE Hyperion、DRIVE AGX）、数据中心技术（LG Energy Solution 的 800V DC 解决方案、LG Uplus 的大型 AI 数据中心并与 NVIDIA DSX 对齐）以及韩国主权 AI。LG AI Research 使用 NVIDIA Blackwell GPU、NeMo 框架以及 Nemotron 数据集开发了 EXAONE，即韩国的主权 AI 模型，并通过企业聊天机器人 ChatEXAONE 部署。LG CNS 还将 NVIDIA 技术整合进其工业平台 PhysicalWorks。

🔗 NVIDIA 博客 — LG Group

NVIDIA + Doosan Group — 物理 AI 与数据中心供电

6月7日 — NVIDIA 与 Doosan Group 将合作扩展到四个实体：Doosan Robotics（Agentic Robot OS，集成 Isaac Sim、Isaac Lab、Cosmos、Newton 物理引擎以及 NVIDIA Jetson Thor——面向拆垛、打磨、双臂机器人和人形机器人等用例）、Doosan Bobcat（自主施工和搬运设备）、Doosan Enerbility（用于高性能 AI 数据中心供电的燃气轮机、蒸汽轮机、小型模块化反应堆 SMR 和氢燃料电池）以及 Doosan Corporation Electro-Materials（NVIDIA MGX 生态中 AI 服务器印刷电路板所用的高性能铜箔基板 CCL）。

🔗 NVIDIA 博客 — Doosan Group

ElevenLabs 与英国政府签署协议，并将伦敦团队规模翻倍

6月8日 — ElevenLabs 与英国 DSIT（科学、创新与技术部）签署了一份谅解备忘录（Memorandum of Understanding），以将语音 AI 部署到英国公共服务中。三大方向：无障碍访问（视障人士、低识字率人群、老年人、威尔士语社区）、AI 安全（与英国 AI 安全研究所合作）以及人才培养。

与此同时，ElevenLabs 今年将英国员工人数翻倍至 200 人，并搬入一个面积大三倍的新伦敦总部。该公司已与 Revolut（为 400 万客户提供 30 种语言的语音代理）、Deliveroo 和 Trainline 展开合作。

🔗 ElevenLabs 博客

Manus — 连接多个 Gmail 和 Google Calendar 账户

6月8日 — Manus（现已并入 Meta）宣布支持同时连接多个 Gmail 和 Google Calendar 账户。用户可以在一个工作流中连接工作、个人、客户和团队邮箱，然后在涉及电子邮件或日历的每项任务中选择 Manus 应该使用哪个账户。这样，代理就能并行协调多个日程以找到可用时段，从正确的账户发送消息，并在无需复杂配置的情况下自动化多账户的重复性任务——只需在提示词中说明要使用哪些账户即可。

🔗 Manus 博客

FLUX.2 [klein] 在 ASUS ProArt 笔记本上本地运行

6月4日 — Black Forest Labs 宣布，FLUX.2 [klein]（40 亿参数），其最快的图像生成模型，现已预装在 ASUS 的 MuseTree 应用中，适用于配备 RTX GPU 的 ProArt 笔记本。目标是在 5 秒内生成一张图像，即使在专业应用程序运行时，也只需 8 GB VRAM。无需互联网连接或 API 调用——模型完全本地运行。

🔗 Black Forest Labs 博客

Kimi Code — 重大更新（CLI、视频、插件、ACP）

6月8日 — Moonshot AI 为其由 Kimi K2.6 驱动的开源代码代理 Kimi Code 发布了一项重要更新。重点放在易用性与可扩展性上：一行 CLI 安装（zero setup, fast startup）、将视频作为代码上下文导入（reference-to-LUT、long-video-to-short、screen-recording-to-code）、金融插件（股票行情、报告）与学术插件（研究论文）、用于代理间通信的 ACP 协议、支持 JetBrains、Zed 及其他 IDE，以及通过 hooks 自定义工具。社区贡献（issues、插件、PRs）也受到鼓励。

🔗 @KimiDevs 公告 · 🔗 Kimi Code

Grok — Design Arena 第1名视频以及接入 Notion AI

Grok Imagine Video 1.5 Preview — Image-to-Video 排名第1

6月8日 — xAI 的 Grok Imagine Video 1.5 Preview 在 Design Arena 的 Image-to-Video 排行榜中名列第一，Elo 分数为 1357。该模型在速度与成本方面建立了新的性能前沿（Pareto frontiers）：平均生成时间 41.2 秒，480p 分辨率下价格为 $0.01/张图像 和 $0.08/秒。这一排名证实了该模型在独立基准上相较竞争方案的竞争力，并基于 6 月 3 日 Grok Imagine 1.5 Preview 在 API 中的发布。

🔗 @grok 公告

Grok 4.3 + Grok Build 0.1 进入 Notion AI

6月2日 — xAI 的 Grok 4.3 和 Grok Build 0.1 现已可在 Notion AI 中使用，Notion AI 是集成在信息管理平台 Notion 中的 AI 层。这一整合为 Notion 用户带来了由 Grok 模型驱动的高级搜索、写作辅助和数据库管理能力。这是在不到一周内 Grok 进入生产力工具的第二次重大集成；此前于 6 月 3 日宣布已集成到 Vapi——这体现了 xAI 在 2026 年 6 月的多平台分发策略。

🔗 @grok 公告

OpenAI Economic Research Exchange — 开放提案征集

6月8日 — OpenAI 启动 OpenAI Economic Research Exchange，这是一个用于资助外部学术研究、聚焦 AI 经济影响的结构化项目。入选研究人员将与 OpenAI Economic Research 团队合作，并可访问 OpenAI 的工具和数据。申请开放至 2026年7月5日；入选通知将于 2026年7月31日 发出。

参数	详情
申请截止	2026年7月5日
入选通知	2026年7月31日
涵盖领域	劳动经济、生产率、教育、不平等、创业
联系方式	econresearch@openai.com

🔗 OpenAI Economic Research Exchange

简讯

Boris Cherny 的五个让 Claude Opus 自主运行的建议 — auto mode、动态工作流、/loop、云端的 Claude Code，以及端到端验证（Chrome 扩展、通过 MCP 的 iOS/Android 模拟器、完整服务器启动）。🔗 @bcherny 的推文
Runway — 使用 Aleph 2.0 自动重设画幅比例 — 导入现有视频，选择目标格式（例如 16:9 → 9:16），模型 Aleph 2.0 会像它本来就是按该格式拍摄的一样补全场景。可在 app.runwayml.com 使用。🔗 @runwayml 的推文
Kling AI — 2 周年：1 亿用户 — 1 亿用户和近 5 万企业客户，一年内进行 26 次模型迭代。🔗 @Kling_ai 的推文
Alibaba Wan Character X — 即时生成独特面孔、个性化头像和原创视觉身份，可在 create.wan.video/lab/playground/character 上测试。🔗 @Alibaba_Wan 的推文
Perplexity Billion Dollar Build — 6 月 9 日直播决赛 — 1,500 支队伍参与了为期 7 周的比赛。8 支决赛队伍将与 Lewis Hamilton（F1 7× 冠军）、Arav Srinivas（Perplexity CEO）和 Rich Miner（Android 联合创始人）一起进行现场直播评审。🔗 @perplexity_ai 的推文

这意味着什么

自主智能体正从概念走向经验测量。 Perplexity × Harvard 的研究是一次方法论上的转折：它首次将通用智能体（Computer）与对话式助手（Search）进行比较，样本覆盖三个月内数十万真实用户。那些数字——耗时 -87%、成本 -94%、机器执行 ×48——不是实验室里搭建出来的基准，而是真实使用条件下的测量结果。再结合 NotebookLM 切换到智能体模式，以及 Kimi Work 在本地并行部署 300 个智能体的结果，2026 年 6 月 8 日这一周标志着智能体承诺开始在规模上变得可观察。

工业级 AI 主权正在韩国成形。 NVIDIA 与 LG Group、Doosan Group 的两项合作并不只是商业协议：它们正在构建一条完整的物理 AI 产业链，从能源生成（Doosan Enerbility 的 SMR 和氢燃料电池）到印刷电路板材料（Doosan Electro-Materials），再到工业机器人（Doosan Robotics）以及消费级家电（LG CLoiD）。由 LG AI Research 在 Blackwell 上开发的 EXAONE 模型，证实韩国正在建设一种以 NVIDIA 基础设施为核心的主权 AI——这与法国围绕 Mistral 的路径类似，但工业规模更大。

语音 AI 正在公共部门制度化。 ElevenLabs 与英国政府（DSIT）的协议代表了一个新阶段：各国政府不再只是观察或监管，而是与私营参与者签署谅解备忘录（MOU），把语音 AI 部署到敏感的公共服务中（无障碍、安全、威尔士语等少数语言）。这种制度化，再加上 ElevenLabs for Government 已在乌克兰、捷克共和国和希腊开展的项目，勾勒出一个正从试点走向部署的公共语音 AI 市场。

多智能体开发者工具正在标准化。 同一天，Moonshot AI 同时发布了 Kimi Work（本地并行 300 个智能体、WebBridge、持久记忆）和 Kimi Code 的重构版（单行 CLI、视频作为上下文、智能体间 ACP 协议、JetBrains/Zed）。这一“办公智能体 + 代码智能体”的协调双发布，反映出一种垂直覆盖策略：同一厂商同时提供办公自动化和开发自动化。这是对 Claude Code 和 Codex CLI 的直接回应，但显著区别在于默认本地执行。

NotebookLM 变得更具代理性，Kimi Work 发布 300 个本地代理，哈佛关于 AI 代理的研究

NotebookLM 变得更具代理性 — 在网页端全球部署

Kimi Work — 配备 300 个并行代理的本地桌面代理

Perplexity × 哈佛 — AI 代理将工作时间减少 87%

Claude Code 一周年 — 与 Boris Cherny 和 Cat Wu 的视频回顾

Anthropic Science Blog — 为生物学中的代理构建基础设施

Google AI Plus — $7.99 → $4.99/月，200 GB → 400 GB 存储

Gemini Live — 实时创建和编辑图像

NVIDIA 在韩国编织其 AI 工厂

NVIDIA + LG Group — 机器人、EXAONE 与数据中心

NVIDIA + Doosan Group — 物理 AI 与数据中心供电

ElevenLabs 与英国政府签署协议，并将伦敦团队规模翻倍

Manus — 连接多个 Gmail 和 Google Calendar 账户

FLUX.2 [klein] 在 ASUS ProArt 笔记本上本地运行

Kimi Code — 重大更新（CLI、视频、插件、ACP）

Grok — Design Arena 第1名视频以及接入 Notion AI

Grok Imagine Video 1.5 Preview — Image-to-Video 排名第1

Grok 4.3 + Grok Build 0.1 进入 Notion AI

OpenAI Economic Research Exchange — 开放提案征集

简讯

这意味着什么

来源

目录