ai-powered-markdown-translator由 gpt-5.4-mini 将法语翻译成中文的文章。
2026年6月6日至8日这一周由自主代理的兴起所主导:NotebookLM 切换到代理模式,Kimi 同时发布 Work(300 个本地代理的集群)以及 Code 的重大更新,Perplexity 还与哈佛联合发布了首个关于企业中代理的重大实证研究——时间减少 87%,成本降低 94%。与此同时,NVIDIA 在韩国签下两项合作(LG Group 和 Doosan),Google 下调了其 AI Plus 订阅价格,ElevenLabs 也通过政府协议在英国落地。
NotebookLM 变得更具代理性 — 在网页端全球部署
6月8日 — Google 为其 AI 辅助笔记和研究工具 NotebookLM 发布了一项重大更新。该应用现已在聊天中具备代理能力(agentic capabilities)、更先进的推理(more advanced reasoning),以及一系列新的优化。从 6 月 8 日起,网页版将开始全球部署。
Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning, and a suite of new optimizations.
🇨🇳 更强大的 NotebookLM 来了——大规模更新为聊天带来代理能力、更先进的推理,以及一系列新的优化。 — @NotebookLM 在 X 上
这项公告早在 6 月 5 日那条神秘推文之后就备受期待——“Ok, it’s probably about time we changed the game. Stay tuned 👀“——该推文已获得 41.5 万次浏览和 3,766 个赞。部署首先面向 Google AI Ultra 订阅用户和 Google Workspace 客户,然后再逐步扩展到其他网页用户。
这一演进使 NotebookLM 从智能笔记工具转变为真正的自主研究代理,能够在对话中更独立地执行任务。该方向与 Google 在 I/O 2026 上宣布的“agentic era”战略一致:Google 的应用如今集成了自主行动循环,而不仅仅是对话式辅助。
| 方面 | 之前 | 之后 |
|---|---|---|
| 工作方式 | 对话式辅助 | 聊天中的代理能力 |
| 推理 | 标准 | 先进推理 |
| 可用性 | 网页端(已有) | 自 6 月 8 日起网页端全球部署 |
Kimi Work — 配备 300 个并行代理的本地桌面代理
6月8日 — Moonshot AI 发布 Kimi Work,这是一个原生桌面 AI 代理,能够在 macOS(Apple Silicon)和 Windows 上本地运行。其最具特色的功能是一个代理集群(agent swarm)架构,可在本地机器上并行运行多达 300 个代理,无需系统性地依赖云端。
Meet Kimi Work - a local AI agent on your desktop that does the work for you. Native agent swarm: Up to 300 AI agents running in parallel on your local machine.
🇨🇳 了解 Kimi Work——你电脑上的本地 AI 代理,为你工作。原生代理集群:你的机器上可并行运行多达 300 个 AI 代理。 — @Kimi_Moonshot 在 X 上
核心功能:
| 功能 | 描述 |
|---|---|
| 原生代理集群 | 在本地机器上可并行运行多达 300 个 AI 代理 |
| 浏览器使用 | 通过 WebBridge 扩展来浏览、搜索、点击并完成网页任务 |
| 集成金融数据 | 原生接入 Yahoo Finance 和 World Bank,无需复杂的 API 配置 |
| 持久记忆 | 记录偏好、过往决策和用户上下文历史 |
| 平台 | macOS(Apple Silicon)和 Windows |
Kimi Work 现已在 kimi.com/products/kimi-work 上线。
Perplexity × 哈佛 — AI 代理将工作时间减少 87%
6月8日 — Perplexity 发布了一项与哈佛商学院研究人员共同开展、历时三个月(2026年2月—5月)的实证研究。这是首次在真实环境中,对会话式助手(Search)与自主生产力代理(Computer)进行的大规模比较,覆盖了数十万活跃用户。
结果令人瞩目:Computer 完成任务所需时间比仅使用 Search 少 87%,成本 低 94%。每次会话的自主机器执行时间从 33 秒提升到 26 分钟——相当于 ×48。
| 指标 | Search + 人工 | Computer + 人工 | 收益 |
|---|---|---|---|
| 平均每项任务耗时 | 269 分钟 | 36 分钟 | −87% |
| 估算成本 | (基准) | −94% | |
| 每次会话的机器执行时间 | 33 秒 | 26 分钟 | ×48 |
| “创建”级别任务(Bloom) | 26% | 50% | |
| 非主要职业领域工作 | 50% | 59% | |
| 每次查询涉及的知识领域 | 1.74 | 2.40 | +38% |
Computer 的优势在所分析的全部 18 个领域中都得到了验证,节省时间达 79% 至 92%,节省成本达 87% 至 96%。研究表明,自主代理不仅让现有任务更快,也改变了所执行工作的本质。Computer 的用户将执行交给机器,从而能够处理超出其主要领域能力范围的任务。
🔗 完整研究 — research.perplexity.ai · 🔗 @perplexity_ai 公告
Claude Code 一周年 — 与 Boris Cherny 和 Cat Wu 的视频回顾
6月8日 — Anthropic 发布了一段 YouTube 视频,庆祝 Claude Code 正式发布一周年。Boris Cherny(@bcherny)和 Cat Wu(@_catwu)回顾了项目历史:最初的内部演示只收到了两条 Slack 反应。一年后,Anthropic 工程师平均每个季度提交的代码量是 2021-2022 年的 8 倍。
视频涵盖四个主题:选择 auto 模式而非 plan 模式、验证最佳实践(verification best practices)、例程和循环(routines and loops)作为自动化机制,以及借助云端的 Claude Code 从手机上编码。
🔗 YouTube 视频 — Claude Code 一周年
Anthropic Science Blog — 为生物学中的代理构建基础设施
6月8日 — Anthropic 发布了一篇 Science Blog(“Paving the way for agents in biology”)文章,提出一个核心问题:为什么 AI 代理在软件开发上的进展远快于生物学?答案是:生物数据库是为人类设计的,而不是为代理设计的——它们更像是*“在汽车出现之前建造的城市”*。
团队开发了 gget virus,这是一个用于病毒数据检索的确定性层,并开发了用于评估病毒数据上代理表现的基准 VirBench。关键结果:借助 gget virus,GPT-5.5 达到 99.7% 的准确率,Claude Sonnet 4 超过 90%——模型选择变得次要。
🔗 Anthropic Science Blog · 🔗 @AnthropicAI 公告
Google AI Plus — $7.99 → $4.99/月,200 GB → 400 GB 存储
6月8日 — Google 将其 AI Plus 订阅价格从 $7.99/月降至 $4.99/月(或当地等值价格),降幅为 37.5%。与此同时,包含的存储空间从 200 GB 翻倍至 400 GB。该公告由 Gemini AI 订阅产品负责人 Vikas Kansal 发布,并被 @GeminiApp 和 @NewsFromGoogle 正式转发。
| 方面 | 之前 | 之后 |
|---|---|---|
| 月费 | $7.99/月 | $4.99/月 |
| 包含存储 | 200 GB | 400 GB |
Gemini Live — 实时创建和编辑图像
6月5日 — Google 宣布可直接在 Gemini Live 中进行图像创建和编辑,并可在语音与视觉对话过程中使用。该功能支持实时视觉迭代:室内装饰(room decor)、创意可视化,或在不离开 Live 界面的情况下边对话边修图。该公告在 X 上获得了 560 万次浏览、1,982 个赞和 295 次转发——是本周 Gemini 领域最受关注的推文之一。
🔗 @GeminiApp 公告 · 🔗 Gemini Live — 功能概览
NVIDIA 在韩国编织其 AI 工厂
NVIDIA + LG Group — 机器人、EXAONE 与数据中心
6月7日 — NVIDIA 与 LG Group 宣布共建一座覆盖四个领域的 AI Factory:机器人(CLoiD 机器人、Isaac Sim 和 Isaac Lab)、自动驾驶(DRIVE Hyperion、DRIVE AGX)、数据中心技术(LG Energy Solution 的 800V DC 解决方案、LG Uplus 的大型 AI 数据中心并与 NVIDIA DSX 对齐)以及韩国主权 AI。LG AI Research 使用 NVIDIA Blackwell GPU、NeMo 框架以及 Nemotron 数据集开发了 EXAONE,即韩国的主权 AI 模型,并通过企业聊天机器人 ChatEXAONE 部署。LG CNS 还将 NVIDIA 技术整合进其工业平台 PhysicalWorks。
NVIDIA + Doosan Group — 物理 AI 与数据中心供电
6月7日 — NVIDIA 与 Doosan Group 将合作扩展到四个实体:Doosan Robotics(Agentic Robot OS,集成 Isaac Sim、Isaac Lab、Cosmos、Newton 物理引擎以及 NVIDIA Jetson Thor——面向拆垛、打磨、双臂机器人和人形机器人等用例)、Doosan Bobcat(自主施工和搬运设备)、Doosan Enerbility(用于高性能 AI 数据中心供电的燃气轮机、蒸汽轮机、小型模块化反应堆 SMR 和氢燃料电池)以及 Doosan Corporation Electro-Materials(NVIDIA MGX 生态中 AI 服务器印刷电路板所用的高性能铜箔基板 CCL)。
ElevenLabs 与英国政府签署协议,并将伦敦团队规模翻倍
6月8日 — ElevenLabs 与英国 DSIT(科学、创新与技术部)签署了一份谅解备忘录(Memorandum of Understanding),以将语音 AI 部署到英国公共服务中。三大方向:无障碍访问(视障人士、低识字率人群、老年人、威尔士语社区)、AI 安全(与英国 AI 安全研究所合作)以及人才培养。
与此同时,ElevenLabs 今年将英国员工人数翻倍至 200 人,并搬入一个面积大三倍的新伦敦总部。该公司已与 Revolut(为 400 万客户提供 30 种语言的语音代理)、Deliveroo 和 Trainline 展开合作。
Manus — 连接多个 Gmail 和 Google Calendar 账户
6月8日 — Manus(现已并入 Meta)宣布支持同时连接多个 Gmail 和 Google Calendar 账户。用户可以在一个工作流中连接工作、个人、客户和团队邮箱,然后在涉及电子邮件或日历的每项任务中选择 Manus 应该使用哪个账户。这样,代理就能并行协调多个日程以找到可用时段,从正确的账户发送消息,并在无需复杂配置的情况下自动化多账户的重复性任务——只需在提示词中说明要使用哪些账户即可。
🔗 Manus 博客
FLUX.2 [klein] 在 ASUS ProArt 笔记本上本地运行
6月4日 — Black Forest Labs 宣布,FLUX.2 [klein](40 亿参数),其最快的图像生成模型,现已预装在 ASUS 的 MuseTree 应用中,适用于配备 RTX GPU 的 ProArt 笔记本。目标是在 5 秒内生成一张图像,即使在专业应用程序运行时,也只需 8 GB VRAM。无需互联网连接或 API 调用——模型完全本地运行。
Kimi Code — 重大更新(CLI、视频、插件、ACP)
6月8日 — Moonshot AI 为其由 Kimi K2.6 驱动的开源代码代理 Kimi Code 发布了一项重要更新。重点放在易用性与可扩展性上:一行 CLI 安装(zero setup, fast startup)、将视频作为代码上下文导入(reference-to-LUT、long-video-to-short、screen-recording-to-code)、金融插件(股票行情、报告)与学术插件(研究论文)、用于代理间通信的 ACP 协议、支持 JetBrains、Zed 及其他 IDE,以及通过 hooks 自定义工具。社区贡献(issues、插件、PRs)也受到鼓励。
🔗 @KimiDevs 公告 · 🔗 Kimi Code
Grok — Design Arena 第1名视频以及接入 Notion AI
Grok Imagine Video 1.5 Preview — Image-to-Video 排名第1
6月8日 — xAI 的 Grok Imagine Video 1.5 Preview 在 Design Arena 的 Image-to-Video 排行榜中名列第一,Elo 分数为 1357。该模型在速度与成本方面建立了新的性能前沿(Pareto frontiers):平均生成时间 41.2 秒,480p 分辨率下价格为 $0.01/张图像 和 $0.08/秒。这一排名证实了该模型在独立基准上相较竞争方案的竞争力,并基于 6 月 3 日 Grok Imagine 1.5 Preview 在 API 中的发布。
🔗 @grok 公告
Grok 4.3 + Grok Build 0.1 进入 Notion AI
6月2日 — xAI 的 Grok 4.3 和 Grok Build 0.1 现已可在 Notion AI 中使用,Notion AI 是集成在信息管理平台 Notion 中的 AI 层。这一整合为 Notion 用户带来了由 Grok 模型驱动的高级搜索、写作辅助和数据库管理能力。这是在不到一周内 Grok 进入生产力工具的第二次重大集成;此前于 6 月 3 日宣布已集成到 Vapi——这体现了 xAI 在 2026 年 6 月的多平台分发策略。
🔗 @grok 公告
OpenAI Economic Research Exchange — 开放提案征集
6月8日 — OpenAI 启动 OpenAI Economic Research Exchange,这是一个用于资助外部学术研究、聚焦 AI 经济影响的结构化项目。入选研究人员将与 OpenAI Economic Research 团队合作,并可访问 OpenAI 的工具和数据。申请开放至 2026年7月5日;入选通知将于 2026年7月31日 发出。
| 参数 | 详情 |
|---|---|
| 申请截止 | 2026年7月5日 |
| 入选通知 | 2026年7月31日 |
| 涵盖领域 | 劳动经济、生产率、教育、不平等、创业 |
| 联系方式 | econresearch@openai.com |
🔗 OpenAI Economic Research Exchange
简讯
- Boris Cherny 的五个让 Claude Opus 自主运行的建议 — auto mode、动态工作流、
/loop、云端的 Claude Code,以及端到端验证(Chrome 扩展、通过 MCP 的 iOS/Android 模拟器、完整服务器启动)。🔗 @bcherny 的推文 - Runway — 使用 Aleph 2.0 自动重设画幅比例 — 导入现有视频,选择目标格式(例如 16:9 → 9:16),模型 Aleph 2.0 会像它本来就是按该格式拍摄的一样补全场景。可在 app.runwayml.com 使用。🔗 @runwayml 的推文
- Kling AI — 2 周年:1 亿用户 — 1 亿用户和近 5 万企业客户,一年内进行 26 次模型迭代。🔗 @Kling_ai 的推文
- Alibaba Wan Character X — 即时生成独特面孔、个性化头像和原创视觉身份,可在 create.wan.video/lab/playground/character 上测试。🔗 @Alibaba_Wan 的推文
- Perplexity Billion Dollar Build — 6 月 9 日直播决赛 — 1,500 支队伍参与了为期 7 周的比赛。8 支决赛队伍将与 Lewis Hamilton(F1 7× 冠军)、Arav Srinivas(Perplexity CEO)和 Rich Miner(Android 联合创始人)一起进行现场直播评审。🔗 @perplexity_ai 的推文
这意味着什么
自主智能体正从概念走向经验测量。 Perplexity × Harvard 的研究是一次方法论上的转折:它首次将通用智能体(Computer)与对话式助手(Search)进行比较,样本覆盖三个月内数十万真实用户。那些数字——耗时 -87%、成本 -94%、机器执行 ×48——不是实验室里搭建出来的基准,而是真实使用条件下的测量结果。再结合 NotebookLM 切换到智能体模式,以及 Kimi Work 在本地并行部署 300 个智能体的结果,2026 年 6 月 8 日这一周标志着智能体承诺开始在规模上变得可观察。
工业级 AI 主权正在韩国成形。 NVIDIA 与 LG Group、Doosan Group 的两项合作并不只是商业协议:它们正在构建一条完整的物理 AI 产业链,从能源生成(Doosan Enerbility 的 SMR 和氢燃料电池)到印刷电路板材料(Doosan Electro-Materials),再到工业机器人(Doosan Robotics)以及消费级家电(LG CLoiD)。由 LG AI Research 在 Blackwell 上开发的 EXAONE 模型,证实韩国正在建设一种以 NVIDIA 基础设施为核心的主权 AI——这与法国围绕 Mistral 的路径类似,但工业规模更大。
语音 AI 正在公共部门制度化。 ElevenLabs 与英国政府(DSIT)的协议代表了一个新阶段:各国政府不再只是观察或监管,而是与私营参与者签署谅解备忘录(MOU),把语音 AI 部署到敏感的公共服务中(无障碍、安全、威尔士语等少数语言)。这种制度化,再加上 ElevenLabs for Government 已在乌克兰、捷克共和国和希腊开展的项目,勾勒出一个正从试点走向部署的公共语音 AI 市场。
多智能体开发者工具正在标准化。 同一天,Moonshot AI 同时发布了 Kimi Work(本地并行 300 个智能体、WebBridge、持久记忆)和 Kimi Code 的重构版(单行 CLI、视频作为上下文、智能体间 ACP 协议、JetBrains/Zed)。这一“办公智能体 + 代码智能体”的协调双发布,反映出一种垂直覆盖策略:同一厂商同时提供办公自动化和开发自动化。这是对 Claude Code 和 Codex CLI 的直接回应,但显著区别在于默认本地执行。
来源
- NotebookLM — 智能体能力公告
- NotebookLM — 全球部署
- Kimi Work — 官方公告
- Kimi Work — 产品页面
- Perplexity × Harvard — 公告
- Perplexity × Harvard — 完整研究
- Claude Code — 一周年(视频)
- Claude Code — 周年纪念(@ClaudeDevs)
- Anthropic Science Blog — 生物学中的智能体
- Anthropic — Science Blog 公告
- Google AI Plus — 新定价
- Google AI Plus — @NewsFromGoogle
- Gemini Live — 实时创建图像
- NVIDIA + LG Group — AI Factory
- NVIDIA + Doosan Group — Physical AI
- ElevenLabs — 英国政府 MOU
- ElevenLabs — X 上的公告
- Manus — 多个 Gmail 和 Calendar 账户
- Manus — X 上的公告
- FLUX.2 klein — 设备端 ASUS ProArt
- FLUX.2 klein — X 上的公告
- Kimi Code — 重大更新
- Kimi Code — 产品页面
- Grok Imagine Video 1.5 — #1 Design Arena
- Notion AI 中的 Grok 4.3 + Build 0.1
- OpenAI 经济研究交流
- Boris Cherny — Claude Opus 自主运行的 5 个建议
- Runway — Aleph 2.0 画幅比例重设
- Kling AI — 2 周年 1 亿用户
- Alibaba Wan Character X
- Perplexity Billion Dollar Build — 6 月 9 日决赛