搜索

NotebookLM 变得更具代理性,Kimi Work 发布 300 个本地代理,哈佛关于 AI 代理的研究

NotebookLM 变得更具代理性,Kimi Work 发布 300 个本地代理,哈佛关于 AI 代理的研究

ai-powered-markdown-translator

由 gpt-5.4-mini 将法语翻译成中文的文章。

在 GitHub 上查看项目 ↗

2026年6月6日至8日这一周由自主代理的兴起所主导:NotebookLM 切换到代理模式,Kimi 同时发布 Work(300 个本地代理的集群)以及 Code 的重大更新,Perplexity 还与哈佛联合发布了首个关于企业中代理的重大实证研究——时间减少 87%,成本降低 94%。与此同时,NVIDIA 在韩国签下两项合作(LG Group 和 Doosan),Google 下调了其 AI Plus 订阅价格,ElevenLabs 也通过政府协议在英国落地。


NotebookLM 变得更具代理性 — 在网页端全球部署

6月8日 — Google 为其 AI 辅助笔记和研究工具 NotebookLM 发布了一项重大更新。该应用现已在聊天中具备代理能力(agentic capabilities、更先进的推理(more advanced reasoning),以及一系列新的优化。从 6 月 8 日起,网页版将开始全球部署。

Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning, and a suite of new optimizations.

🇨🇳 更强大的 NotebookLM 来了——大规模更新为聊天带来代理能力、更先进的推理,以及一系列新的优化。@NotebookLM 在 X 上

这项公告早在 6 月 5 日那条神秘推文之后就备受期待——“Ok, it’s probably about time we changed the game. Stay tuned 👀“——该推文已获得 41.5 万次浏览和 3,766 个赞。部署首先面向 Google AI Ultra 订阅用户和 Google Workspace 客户,然后再逐步扩展到其他网页用户。

这一演进使 NotebookLM 从智能笔记工具转变为真正的自主研究代理,能够在对话中更独立地执行任务。该方向与 Google 在 I/O 2026 上宣布的“agentic era”战略一致:Google 的应用如今集成了自主行动循环,而不仅仅是对话式辅助。

方面之前之后
工作方式对话式辅助聊天中的代理能力
推理标准先进推理
可用性网页端(已有)自 6 月 8 日起网页端全球部署

🔗 @NotebookLM 公告


Kimi Work — 配备 300 个并行代理的本地桌面代理

6月8日 — Moonshot AI 发布 Kimi Work,这是一个原生桌面 AI 代理,能够在 macOS(Apple Silicon)和 Windows 上本地运行。其最具特色的功能是一个代理集群(agent swarm)架构,可在本地机器上并行运行多达 300 个代理,无需系统性地依赖云端。

Meet Kimi Work - a local AI agent on your desktop that does the work for you. Native agent swarm: Up to 300 AI agents running in parallel on your local machine.

🇨🇳 了解 Kimi Work——你电脑上的本地 AI 代理,为你工作。原生代理集群:你的机器上可并行运行多达 300 个 AI 代理。@Kimi_Moonshot 在 X 上

核心功能:

功能描述
原生代理集群在本地机器上可并行运行多达 300 个 AI 代理
浏览器使用通过 WebBridge 扩展来浏览、搜索、点击并完成网页任务
集成金融数据原生接入 Yahoo Finance 和 World Bank,无需复杂的 API 配置
持久记忆记录偏好、过往决策和用户上下文历史
平台macOS(Apple Silicon)和 Windows

Kimi Work 现已在 kimi.com/products/kimi-work 上线。


Perplexity × 哈佛 — AI 代理将工作时间减少 87%

6月8日 — Perplexity 发布了一项与哈佛商学院研究人员共同开展、历时三个月(2026年2月—5月)的实证研究。这是首次在真实环境中,对会话式助手(Search)与自主生产力代理(Computer)进行的大规模比较,覆盖了数十万活跃用户。

结果令人瞩目:Computer 完成任务所需时间比仅使用 Search 少 87%,成本 低 94%。每次会话的自主机器执行时间从 33 秒提升到 26 分钟——相当于 ×48

指标Search + 人工Computer + 人工收益
平均每项任务耗时269 分钟36 分钟−87%
估算成本(基准)−94%
每次会话的机器执行时间33 秒26 分钟×48
“创建”级别任务(Bloom)26%50%
非主要职业领域工作50%59%
每次查询涉及的知识领域1.742.40+38%

Computer 的优势在所分析的全部 18 个领域中都得到了验证,节省时间达 79% 至 92%,节省成本达 87% 至 96%。研究表明,自主代理不仅让现有任务更快,也改变了所执行工作的本质。Computer 的用户将执行交给机器,从而能够处理超出其主要领域能力范围的任务。

🔗 完整研究 — research.perplexity.ai · 🔗 @perplexity_ai 公告


Claude Code 一周年 — 与 Boris Cherny 和 Cat Wu 的视频回顾

6月8日 — Anthropic 发布了一段 YouTube 视频,庆祝 Claude Code 正式发布一周年。Boris Cherny(@bcherny)和 Cat Wu(@_catwu)回顾了项目历史:最初的内部演示只收到了两条 Slack 反应。一年后,Anthropic 工程师平均每个季度提交的代码量是 2021-2022 年的 8 倍。

视频涵盖四个主题:选择 auto 模式而非 plan 模式、验证最佳实践(verification best practices)、例程和循环(routines and loops)作为自动化机制,以及借助云端的 Claude Code 从手机上编码。

🔗 YouTube 视频 — Claude Code 一周年


Anthropic Science Blog — 为生物学中的代理构建基础设施

6月8日 — Anthropic 发布了一篇 Science Blog(“Paving the way for agents in biology”)文章,提出一个核心问题:为什么 AI 代理在软件开发上的进展远快于生物学?答案是:生物数据库是为人类设计的,而不是为代理设计的——它们更像是*“在汽车出现之前建造的城市”*。

团队开发了 gget virus,这是一个用于病毒数据检索的确定性层,并开发了用于评估病毒数据上代理表现的基准 VirBench。关键结果:借助 gget virus,GPT-5.5 达到 99.7% 的准确率,Claude Sonnet 4 超过 90%——模型选择变得次要。

🔗 Anthropic Science Blog · 🔗 @AnthropicAI 公告


Google AI Plus — $7.99 → $4.99/月,200 GB → 400 GB 存储

6月8日 — Google 将其 AI Plus 订阅价格从 $7.99/月降至 $4.99/月(或当地等值价格),降幅为 37.5%。与此同时,包含的存储空间从 200 GB 翻倍至 400 GB。该公告由 Gemini AI 订阅产品负责人 Vikas Kansal 发布,并被 @GeminiApp 和 @NewsFromGoogle 正式转发。

方面之前之后
月费$7.99/月$4.99/月
包含存储200 GB400 GB

🔗 @vikaskansalHQ 公告


Gemini Live — 实时创建和编辑图像

6月5日 — Google 宣布可直接在 Gemini Live 中进行图像创建和编辑,并可在语音与视觉对话过程中使用。该功能支持实时视觉迭代:室内装饰(room decor)、创意可视化,或在不离开 Live 界面的情况下边对话边修图。该公告在 X 上获得了 560 万次浏览、1,982 个赞和 295 次转发——是本周 Gemini 领域最受关注的推文之一。

🔗 @GeminiApp 公告 · 🔗 Gemini Live — 功能概览


NVIDIA 在韩国编织其 AI 工厂

NVIDIA + LG Group — 机器人、EXAONE 与数据中心

6月7日 — NVIDIA 与 LG Group 宣布共建一座覆盖四个领域的 AI Factory:机器人(CLoiD 机器人、Isaac Sim 和 Isaac Lab)、自动驾驶(DRIVE Hyperion、DRIVE AGX)、数据中心技术(LG Energy Solution 的 800V DC 解决方案、LG Uplus 的大型 AI 数据中心并与 NVIDIA DSX 对齐)以及韩国主权 AI。LG AI Research 使用 NVIDIA Blackwell GPU、NeMo 框架以及 Nemotron 数据集开发了 EXAONE,即韩国的主权 AI 模型,并通过企业聊天机器人 ChatEXAONE 部署。LG CNS 还将 NVIDIA 技术整合进其工业平台 PhysicalWorks。

🔗 NVIDIA 博客 — LG Group

NVIDIA + Doosan Group — 物理 AI 与数据中心供电

6月7日 — NVIDIA 与 Doosan Group 将合作扩展到四个实体:Doosan Robotics(Agentic Robot OS,集成 Isaac Sim、Isaac Lab、Cosmos、Newton 物理引擎以及 NVIDIA Jetson Thor——面向拆垛、打磨、双臂机器人和人形机器人等用例)、Doosan Bobcat(自主施工和搬运设备)、Doosan Enerbility(用于高性能 AI 数据中心供电的燃气轮机、蒸汽轮机、小型模块化反应堆 SMR 和氢燃料电池)以及 Doosan Corporation Electro-Materials(NVIDIA MGX 生态中 AI 服务器印刷电路板所用的高性能铜箔基板 CCL)。

🔗 NVIDIA 博客 — Doosan Group


ElevenLabs 与英国政府签署协议,并将伦敦团队规模翻倍

6月8日 — ElevenLabs 与英国 DSIT(科学、创新与技术部)签署了一份谅解备忘录(Memorandum of Understanding),以将语音 AI 部署到英国公共服务中。三大方向:无障碍访问(视障人士、低识字率人群、老年人、威尔士语社区)、AI 安全(与英国 AI 安全研究所合作)以及人才培养。

与此同时,ElevenLabs 今年将英国员工人数翻倍至 200 人,并搬入一个面积大三倍的新伦敦总部。该公司已与 Revolut(为 400 万客户提供 30 种语言的语音代理)、Deliveroo 和 Trainline 展开合作。

🔗 ElevenLabs 博客


Manus — 连接多个 Gmail 和 Google Calendar 账户

6月8日 — Manus(现已并入 Meta)宣布支持同时连接多个 Gmail 和 Google Calendar 账户。用户可以在一个工作流中连接工作、个人、客户和团队邮箱,然后在涉及电子邮件或日历的每项任务中选择 Manus 应该使用哪个账户。这样,代理就能并行协调多个日程以找到可用时段,从正确的账户发送消息,并在无需复杂配置的情况下自动化多账户的重复性任务——只需在提示词中说明要使用哪些账户即可。

🔗 Manus 博客


FLUX.2 [klein] 在 ASUS ProArt 笔记本上本地运行

6月4日 — Black Forest Labs 宣布,FLUX.2 [klein](40 亿参数),其最快的图像生成模型,现已预装在 ASUS 的 MuseTree 应用中,适用于配备 RTX GPU 的 ProArt 笔记本。目标是在 5 秒内生成一张图像,即使在专业应用程序运行时,也只需 8 GB VRAM。无需互联网连接或 API 调用——模型完全本地运行。

🔗 Black Forest Labs 博客


Kimi Code — 重大更新(CLI、视频、插件、ACP)

6月8日 — Moonshot AI 为其由 Kimi K2.6 驱动的开源代码代理 Kimi Code 发布了一项重要更新。重点放在易用性与可扩展性上:一行 CLI 安装(zero setup, fast startup)、将视频作为代码上下文导入(reference-to-LUTlong-video-to-shortscreen-recording-to-code)、金融插件(股票行情、报告)与学术插件(研究论文)、用于代理间通信的 ACP 协议、支持 JetBrains、Zed 及其他 IDE,以及通过 hooks 自定义工具。社区贡献(issues、插件、PRs)也受到鼓励。

🔗 @KimiDevs 公告 · 🔗 Kimi Code


Grok — Design Arena 第1名视频以及接入 Notion AI

Grok Imagine Video 1.5 Preview — Image-to-Video 排名第1

6月8日 — xAI 的 Grok Imagine Video 1.5 Preview 在 Design Arena 的 Image-to-Video 排行榜中名列第一,Elo 分数为 1357。该模型在速度与成本方面建立了新的性能前沿(Pareto frontiers):平均生成时间 41.2 秒,480p 分辨率下价格为 $0.01/张图像$0.08/秒。这一排名证实了该模型在独立基准上相较竞争方案的竞争力,并基于 6 月 3 日 Grok Imagine 1.5 Preview 在 API 中的发布。

🔗 @grok 公告

Grok 4.3 + Grok Build 0.1 进入 Notion AI

6月2日 — xAI 的 Grok 4.3 和 Grok Build 0.1 现已可在 Notion AI 中使用,Notion AI 是集成在信息管理平台 Notion 中的 AI 层。这一整合为 Notion 用户带来了由 Grok 模型驱动的高级搜索、写作辅助和数据库管理能力。这是在不到一周内 Grok 进入生产力工具的第二次重大集成;此前于 6 月 3 日宣布已集成到 Vapi——这体现了 xAI 在 2026 年 6 月的多平台分发策略。

🔗 @grok 公告


OpenAI Economic Research Exchange — 开放提案征集

6月8日 — OpenAI 启动 OpenAI Economic Research Exchange,这是一个用于资助外部学术研究、聚焦 AI 经济影响的结构化项目。入选研究人员将与 OpenAI Economic Research 团队合作,并可访问 OpenAI 的工具和数据。申请开放至 2026年7月5日;入选通知将于 2026年7月31日 发出。

参数详情
申请截止2026年7月5日
入选通知2026年7月31日
涵盖领域劳动经济、生产率、教育、不平等、创业
联系方式econresearch@openai.com

🔗 OpenAI Economic Research Exchange


简讯

  • Boris Cherny 的五个让 Claude Opus 自主运行的建议 — auto mode、动态工作流、/loop、云端的 Claude Code,以及端到端验证(Chrome 扩展、通过 MCP 的 iOS/Android 模拟器、完整服务器启动)。🔗 @bcherny 的推文
  • Runway — 使用 Aleph 2.0 自动重设画幅比例 — 导入现有视频,选择目标格式(例如 16:9 → 9:16),模型 Aleph 2.0 会像它本来就是按该格式拍摄的一样补全场景。可在 app.runwayml.com 使用。🔗 @runwayml 的推文
  • Kling AI — 2 周年:1 亿用户 — 1 亿用户和近 5 万企业客户,一年内进行 26 次模型迭代。🔗 @Kling_ai 的推文
  • Alibaba Wan Character X — 即时生成独特面孔、个性化头像和原创视觉身份,可在 create.wan.video/lab/playground/character 上测试。🔗 @Alibaba_Wan 的推文
  • Perplexity Billion Dollar Build — 6 月 9 日直播决赛 — 1,500 支队伍参与了为期 7 周的比赛。8 支决赛队伍将与 Lewis Hamilton(F1 7× 冠军)、Arav Srinivas(Perplexity CEO)和 Rich Miner(Android 联合创始人)一起进行现场直播评审。🔗 @perplexity_ai 的推文

这意味着什么

自主智能体正从概念走向经验测量。 Perplexity × Harvard 的研究是一次方法论上的转折:它首次将通用智能体(Computer)与对话式助手(Search)进行比较,样本覆盖三个月内数十万真实用户。那些数字——耗时 -87%、成本 -94%、机器执行 ×48——不是实验室里搭建出来的基准,而是真实使用条件下的测量结果。再结合 NotebookLM 切换到智能体模式,以及 Kimi Work 在本地并行部署 300 个智能体的结果,2026 年 6 月 8 日这一周标志着智能体承诺开始在规模上变得可观察。

工业级 AI 主权正在韩国成形。 NVIDIA 与 LG Group、Doosan Group 的两项合作并不只是商业协议:它们正在构建一条完整的物理 AI 产业链,从能源生成(Doosan Enerbility 的 SMR 和氢燃料电池)到印刷电路板材料(Doosan Electro-Materials),再到工业机器人(Doosan Robotics)以及消费级家电(LG CLoiD)。由 LG AI Research 在 Blackwell 上开发的 EXAONE 模型,证实韩国正在建设一种以 NVIDIA 基础设施为核心的主权 AI——这与法国围绕 Mistral 的路径类似,但工业规模更大。

语音 AI 正在公共部门制度化。 ElevenLabs 与英国政府(DSIT)的协议代表了一个新阶段:各国政府不再只是观察或监管,而是与私营参与者签署谅解备忘录(MOU),把语音 AI 部署到敏感的公共服务中(无障碍、安全、威尔士语等少数语言)。这种制度化,再加上 ElevenLabs for Government 已在乌克兰、捷克共和国和希腊开展的项目,勾勒出一个正从试点走向部署的公共语音 AI 市场。

多智能体开发者工具正在标准化。 同一天,Moonshot AI 同时发布了 Kimi Work(本地并行 300 个智能体、WebBridge、持久记忆)和 Kimi Code 的重构版(单行 CLI、视频作为上下文、智能体间 ACP 协议、JetBrains/Zed)。这一“办公智能体 + 代码智能体”的协调双发布,反映出一种垂直覆盖策略:同一厂商同时提供办公自动化和开发自动化。这是对 Claude Code 和 Codex CLI 的直接回应,但显著区别在于默认本地执行。


来源