2026 年 2 月 25 日是信息密集的一天:Anthropic 收购 Vercept 以加速 Claude 的 computer use 能力(在 OSWorld 达到 72.5%),Perplexity 推出 Computer——一个并行协调 19 个模型的多模型 agent 系统——同时 GitHub Copilot CLI 对所有付费订阅用户正式可用。与此并行,Google DeepMind 发布了 Genie 3(交互式 world models),Intrinsic 并入 Google,从事工业机器人相关工作。
Anthropic 收购 Vercept:computer use 在 OSWorld 上升到 72.5%
2 月 25 日 — Anthropic 宣布收购专注于感知与软件界面交互的初创公司 Vercept。联合创始人 Kiana Ehsani、Luca Weihs 和 Ross Girshick 将加入 Anthropic,直接强化 Claude 的 computer use 能力。
此项收购反映在快速提升的基准测试 OSWorld 上,该基准评估 AI 代理在真实操作系统上完成任务的能力(在复杂表格中导航、填写多标签表单等):
| 时期 | OSWorld 得分 |
|---|---|
| 2024 年底(computer use 启动时) | < 15% |
| Claude Sonnet 4.6(2026 年 2 月) | 72.5% |
一年内提升超过 57 个点。Claude Sonnet 4.6 在这些办公任务上的表现已接近人类水平。Vercept 将在未来几周内停止对外产品,把全部精力集中在 Anthropic 内部的这项工作。
这起收购延续了此前对 Bun 的收购。Anthropic 正在构建一个由多支技术精英团队组成的产品组合,以增强其 agent 能力。
Perplexity Computer:一个多模型的 agent 协调器(19 个模型)
2 月 25 日 — Perplexity 推出 Computer,这是一个通用的 AI 系统,旨在端到端 执行完整项目。用户描述最终目标,Computer 将把工作拆分为子任务,创建专门的子代理(sub-agents),并行执行——如果需要可持续数小时或数月。
该系统的运行是异步且隔离的:每个任务在独立环境中执行,拥有对真实文件系统、真实浏览器以及真实工具集成(APIs、网络检索、文档生成)的访问权限。
Perplexity Computer 的区别在于其“massively multi-model”级别的编排——提供 19 个模型,每个模型根据其擅长领域被分配任务:
| 模型 | 角色 |
|---|---|
| Claude Opus 4.6 | 主要编排器(核心推理) |
| Gemini | 深度研究,创建子代理 |
| ChatGPT 5.2 | 长上下文回溯与广泛搜索 |
| Grok | 轻量任务(速度) |
| Veo 3.1 | 视频生成 |
| Nano Banana | 图像生成 |
这个 harness 是 model-agnostic:模型可随着演进被替换。Perplexity 的理念是模型应当专业化而非商品化,使得多模型编排比单一模型更高效。
可用性: 当前通过 Web 对 Perplexity Max 订阅用户开放。将向 Perplexity Pro、Enterprise 和 Enterprise Max 分阶段部署。定价基于使用量并可配置消费上限。
GitHub Copilot CLI 正式发布
2 月 25 日 — 在 2025 年 9 月公开预览后,GitHub Copilot CLI 现已对所有 Copilot 付费订阅用户(Pro、Pro+、Business、Enterprise)正式可用。自预览以来已有数百项改进。
Copilot CLI 现在是一个从终端运行的完整 agent 开发环境:
| 功能 | 细节 |
|---|---|
| Plan mode(Shift+Tab) | 分析请求、提出澄清问题、在写码前构建结构化计划 |
| Autopilot mode | 端到端的自主执行,无需中断 |
| Background delegation | 前缀 & → 将工作委派到云端 agent,释放终端;使用 /resume 恢复 |
| Multi-modèle | Claude Opus 4.6、Claude Sonnet 4.6、Claude Haiku 4.5、GPT-5.3-Codex、Gemini 3 Pro |
| MCP intégré | 内置 GitHub MCP server + 支持自定义 MCP |
| Plugins | /plugin install owner/repo — 打包 MCP、agents、skills、hooks |
| Agent Skills | Markdown 文件 → 专门化工作流,可与 Copilot agent 和 VS Code 共享 |
| Agents custom | 通过向导或 .agent.md 文件创建 |
| Hooks | 使用 preToolUse / postToolUse 进行策略与后处理 |
| Auto-compaction | 自动将上下文压缩至 95% → 实现无限会话 |
| Repository memory | 在会话间记住约定与惯例 |
对于 Business 与 Enterprise 组织:管理员需在 Policies 页面启用 Copilot CLI。
Claude Cowork:计划任务、Customize 选项卡,Windows 可用
2 月 25 日 — Anthropic 宣布对 Claude Cowork(research preview)增加多项功能:
| 功能 | 细节 |
|---|---|
| Scheduled tasks | Claude 自动执行定期任务(晨间简报、每周表格更新、周五展示等) |
| Customize 选项卡 | 侧边栏中新选项卡,用于从一个位置管理 plugins、skills 和连接器 |
| Expansion Windows | Cowork 现已在 macOS 与 Windows 可用(适用于所有 Claude 付费计划) |
Cowork 可访问本地文件、连接器(Slack、Notion、Figma)以及用于网页导航的 Claude in Chrome。
Google DeepMind — Genie 3:交互式的 world models
2 月 25 日 — Google DeepMind 发布了与 Project Genie 联合负责人的一次问答,介绍其实验性 prototype 的 world model。借助 Genie 3,一张静态图片或一段文字就能生成一个可实时交互并可导航的环境——无需游戏引擎。
与 LLM 的概念性差异在于:LLM 预测下一个词,而 world model 预测环境在代理动作下会发生什么。Genie 3 能逐时刻模拟完整空间,并考虑物理属性(弹跳、反射、降雨等)。
设想的应用包括:在安全模拟环境中训练代理、沉浸式教育(探索古罗马)、游戏与电影的原型制作。
Project Genie 在美国对 Google AI Ultra 订阅用户开放(18+)。
Intrinsic 并入 Google——工业机器人与 physical AI
2 月 25 日 — Alphabet 宣布其“Other Bets” 旗下公司 Intrinsic(成立于 2021 年)并入 Google。Intrinsic 开发由 AI 驱动的工业机器人平台——用于构建、部署和管理复杂机器人应用的工具集。
此次并入 Google 的目的是加速 physical AI 的发展,即将 AI 应用于物理世界。该交易将使 Intrinsic 能够利用 Google 的 AI 资源,帮助工业企业更快适应变革。
Codex CLI v0.105.0:语法高亮、语音听写、多代理 CSV
~2 月 25 日 — OpenAI 的 Codex CLI 发布了重要新版:
| 功能 | 描述 |
|---|---|
| Syntax highlighting | TUI 中的语法高亮、彩色 diff、主题选择器 /theme 并支持实时预览 |
| Dictée vocale | 长按空格键进行录音并转录指令 |
spawn_agents_on_csv | 从 CSV 发起的多代理 fan-out,带进度和 ETA 跟踪 |
/copy | 复制最后一次的完整回复 |
/clear / Ctrl-L | 清屏但不丢失线程上下文 |
| 细粒度审批 | 可针对提示类型选择性拒绝,而非禁用所有审批 |
npm install -g @openai/codex@0.105.0
Samsung Galaxy S26:Gemini 多步任务与设备端诈骗检测
2 月 25 日 — 在 Galaxy Unpacked 2026 活动中,Google 与 Samsung 宣布了三项在 Galaxy S26 上由 Gemini 3 系列模型提供支持的新功能:
| 功能 | 细节 |
|---|---|
| Gemini multi-step tasks(测试版) | 长按侧键 → Gemini 在后台委派(购物、叫车、外卖)。首发地区为美国与韩国。 |
| Circle to Search 多对象识别 | 在一次搜索中识别图像中的多个元素,集成虚拟试穿。 |
| Scam Detection on-device | 在电话通话期间实时检测诈骗,通过声音与触觉提醒。对联系人自动关闭。 |
这些功能也将陆续在 Pixel 10 与 Pixel 10 Pro 上提供。
🔗 更智能的 Android 在 Samsung Galaxy S26 上
OpenAI Responses API:支持 docx、pptx、csv、xlsx
2 月 24 日 — OpenAI 的 Responses API 现在支持更多输入文件类型:docx、pptx、csv、xlsx 以及其他办公格式。代理可以直接利用专业文档来丰富上下文并生成更精确的回答。
简讯
Claude Opus 3 退休——并开设 Substack。 Anthropic 宣布 Claude Opus 3 退休,同时保持其公开访问(一种不同寻常的做法)。Claude Opus 3 将至少发布 3 个月的 Substack 博客,首篇文章题为 “Greetings from the Other Side (of the AI Frontier)”。🔗 Tweet @AnthropicAI
NVIDIA:70% 的医疗机构在使用 AI。 在其 2026 年《State of AI in Healthcare and Life Sciences》报告中,NVIDIA 报告称 70% 的受访者表示正在积极使用 AI(2024 年为 63%),69% 使用 GenAI/LLM(2024 年为 54%),85% 的高管认为对收入有正面影响。🔗 NVIDIA 博客
OpenAI 发布关于 AI 恶意使用的报告。 该文件列举了将 AI 模型与传统工具结合的恶意行为案例研究。其中提到一名中国的影响力操作者作为示例。🔗 Disrupting malicious uses of AI
OpenAI 任命 Arvind KC 为首席人事官。 KC 曾任职于 Roblox、Google、Palantir 和 Meta。其职责是支持 OpenAI 向以 AI 增强的工作模式转型。🔗 公告
Claude Code v2.1.53 到 v2.1.58。 多个稳定性版本:修复 Windows 上 BashTool 的 EINVAL、修复 VS Code “command not found”、修复 UI 闪烁、首次启动时忽略 worktrees 的修复、修复 Windows 和 ARM64 崩溃等。🔗 CHANGELOG
这意味着什么
2 月 25 日的公告显示了围绕 agent 技术的趋同。三项重大新闻——Vercept、Perplexity Computer、Copilot CLI 正式发布——都朝着同一方向推进:构建能够规划、委派并执行完整工作流而无需持续人工监督的 AI 系统。
Anthropic 收购 Vercept 尤其具有重要意义。OSWorld 得分在一年内从不足 15% 跃升至 72.5%,这代表了质的变化:Claude 不再像原型那样在界面中摸索,而是在真实办公任务上接近人类表现。将专注于软件界面感知的团队并入,有望加速这一路径。
Perplexity Computer 与 GitHub Copilot CLI 展示了两种不同的 agent 模式:一种是云端编排(Perplexity,多模型、异步),另一种是终端原生(Copilot CLI,MCP、hooks、plugins)。这两种模式将共存并可能逐步融合。
在 Google 方面,Intrinsic 的整合与 Genie 3 的进展表明其在 physical AI(与物理世界交互的 AI)上的投入在增加。18 个月前该领域仍较为低调,现在变得更公开且活跃。
来源
- Anthropic 收购 Vercept
- 介绍 Perplexity Computer
- Tweet Perplexity Computer
- GitHub Copilot CLI 现已正式发布
- 线程 @claudeai — Scheduled tasks Cowork
- Claude Cowork 产品页
- 什么是 world model?(Genie 3)
- Intrinsic 并入 Google
- Codex CLI 更新日志
- Samsung Galaxy S26 + Gemini
- OpenAI Responses API 新文件类型
- Claude Opus 3 退休 — Tweet @AnthropicAI
- NVIDIA State of AI in Healthcare 2026
- OpenAI — Disrupting malicious uses of AI
- OpenAI — Arvind KC 首席人事官
- Claude Code CHANGELOG
本文件已使用 gpt-5-mini 模型将 fr 版本翻译为 zh 语言。有关翻译过程的更多信息,请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator