Anthropic 收购 Vercept（computer use 在 OSWorld 达到 72.5%）、Perplexity Computer 协调 19 个模型、GitHub Copilot CLI 正式发布

2026 年 2 月 25 日是信息密集的一天：Anthropic 收购 Vercept 以加速 Claude 的 computer use 能力（在 OSWorld 达到 72.5%），Perplexity 推出 Computer——一个并行协调 19 个模型的多模型 agent 系统——同时 GitHub Copilot CLI 对所有付费订阅用户正式可用。与此并行，Google DeepMind 发布了 Genie 3（交互式 world models），Intrinsic 并入 Google，从事工业机器人相关工作。

Anthropic 收购 Vercept：computer use 在 OSWorld 上升到 72.5%

2 月 25 日 — Anthropic 宣布收购专注于感知与软件界面交互的初创公司 Vercept。联合创始人 Kiana Ehsani、Luca Weihs 和 Ross Girshick 将加入 Anthropic，直接强化 Claude 的 computer use 能力。

此项收购反映在快速提升的基准测试 OSWorld 上，该基准评估 AI 代理在真实操作系统上完成任务的能力（在复杂表格中导航、填写多标签表单等）：

时期	OSWorld 得分
2024 年底（computer use 启动时）	< 15%
Claude Sonnet 4.6（2026 年 2 月）	72.5%

一年内提升超过 57 个点。Claude Sonnet 4.6 在这些办公任务上的表现已接近人类水平。Vercept 将在未来几周内停止对外产品，把全部精力集中在 Anthropic 内部的这项工作。

这起收购延续了此前对 Bun 的收购。Anthropic 正在构建一个由多支技术精英团队组成的产品组合，以增强其 agent 能力。

🔗 Anthropic 收购 Vercept

Perplexity Computer：一个多模型的 agent 协调器（19 个模型）

2 月 25 日 — Perplexity 推出 Computer，这是一个通用的 AI 系统，旨在端到端执行完整项目。用户描述最终目标，Computer 将把工作拆分为子任务，创建专门的子代理（sub-agents），并行执行——如果需要可持续数小时或数月。

该系统的运行是异步且隔离的：每个任务在独立环境中执行，拥有对真实文件系统、真实浏览器以及真实工具集成（APIs、网络检索、文档生成）的访问权限。

Perplexity Computer 的区别在于其“massively multi-model”级别的编排——提供 19 个模型，每个模型根据其擅长领域被分配任务：

模型	角色
Claude Opus 4.6	主要编排器（核心推理）
Gemini	深度研究，创建子代理
ChatGPT 5.2	长上下文回溯与广泛搜索
Grok	轻量任务（速度）
Veo 3.1	视频生成
Nano Banana	图像生成

这个 harness 是 model-agnostic：模型可随着演进被替换。Perplexity 的理念是模型应当专业化而非商品化，使得多模型编排比单一模型更高效。

可用性： 当前通过 Web 对 Perplexity Max 订阅用户开放。将向 Perplexity Pro、Enterprise 和 Enterprise Max 分阶段部署。定价基于使用量并可配置消费上限。

🔗 介绍 Perplexity Computer

GitHub Copilot CLI 正式发布

2 月 25 日 — 在 2025 年 9 月公开预览后，GitHub Copilot CLI 现已对所有 Copilot 付费订阅用户（Pro、Pro+、Business、Enterprise）正式可用。自预览以来已有数百项改进。

Copilot CLI 现在是一个从终端运行的完整 agent 开发环境：

功能	细节
Plan mode（Shift+Tab）	分析请求、提出澄清问题、在写码前构建结构化计划
Autopilot mode	端到端的自主执行，无需中断
Background delegation	前缀 `&` → 将工作委派到云端 agent，释放终端；使用 `/resume` 恢复
Multi-modèle	Claude Opus 4.6、Claude Sonnet 4.6、Claude Haiku 4.5、GPT-5.3-Codex、Gemini 3 Pro
MCP intégré	内置 GitHub MCP server + 支持自定义 MCP
Plugins	`/plugin install owner/repo` — 打包 MCP、agents、skills、hooks
Agent Skills	Markdown 文件 → 专门化工作流，可与 Copilot agent 和 VS Code 共享
Agents custom	通过向导或 `.agent.md` 文件创建
Hooks	使用 `preToolUse` / `postToolUse` 进行策略与后处理
Auto-compaction	自动将上下文压缩至 95% → 实现无限会话
Repository memory	在会话间记住约定与惯例

对于 Business 与 Enterprise 组织：管理员需在 Policies 页面启用 Copilot CLI。

🔗 GitHub Copilot CLI 现已正式发布

Claude Cowork：计划任务、Customize 选项卡，Windows 可用

2 月 25 日 — Anthropic 宣布对 Claude Cowork（research preview）增加多项功能：

功能	细节
Scheduled tasks	Claude 自动执行定期任务（晨间简报、每周表格更新、周五展示等）
Customize 选项卡	侧边栏中新选项卡，用于从一个位置管理 plugins、skills 和连接器
Expansion Windows	Cowork 现已在 macOS 与 Windows 可用（适用于所有 Claude 付费计划）

Cowork 可访问本地文件、连接器（Slack、Notion、Figma）以及用于网页导航的 Claude in Chrome。

🔗 线程 @claudeai

Google DeepMind — Genie 3：交互式的 world models

2 月 25 日 — Google DeepMind 发布了与 Project Genie 联合负责人的一次问答，介绍其实验性 prototype 的 world model。借助 Genie 3，一张静态图片或一段文字就能生成一个可实时交互并可导航的环境——无需游戏引擎。

与 LLM 的概念性差异在于：LLM 预测下一个词，而 world model 预测环境在代理动作下会发生什么。Genie 3 能逐时刻模拟完整空间，并考虑物理属性（弹跳、反射、降雨等）。

设想的应用包括：在安全模拟环境中训练代理、沉浸式教育（探索古罗马）、游戏与电影的原型制作。

Project Genie 在美国对 Google AI Ultra 订阅用户开放（18+）。

🔗 什么是 world model？

Intrinsic 并入 Google——工业机器人与 physical AI

2 月 25 日 — Alphabet 宣布其“Other Bets” 旗下公司 Intrinsic（成立于 2021 年）并入 Google。Intrinsic 开发由 AI 驱动的工业机器人平台——用于构建、部署和管理复杂机器人应用的工具集。

此次并入 Google 的目的是加速 physical AI 的发展，即将 AI 应用于物理世界。该交易将使 Intrinsic 能够利用 Google 的 AI 资源，帮助工业企业更快适应变革。

🔗 Intrinsic 并入 Google

Codex CLI v0.105.0：语法高亮、语音听写、多代理 CSV

~2 月 25 日 — OpenAI 的 Codex CLI 发布了重要新版：

功能	描述
Syntax highlighting	TUI 中的语法高亮、彩色 diff、主题选择器 `/theme` 并支持实时预览
Dictée vocale	长按空格键进行录音并转录指令
`spawn_agents_on_csv`	从 CSV 发起的多代理 fan-out，带进度和 ETA 跟踪
`/copy`	复制最后一次的完整回复
`/clear` / Ctrl-L	清屏但不丢失线程上下文
细粒度审批	可针对提示类型选择性拒绝，而非禁用所有审批

npm install -g @openai/codex@0.105.0

🔗 Codex 更新日志

Samsung Galaxy S26：Gemini 多步任务与设备端诈骗检测

2 月 25 日 — 在 Galaxy Unpacked 2026 活动中，Google 与 Samsung 宣布了三项在 Galaxy S26 上由 Gemini 3 系列模型提供支持的新功能：

功能	细节
Gemini multi-step tasks（测试版）	长按侧键 → Gemini 在后台委派（购物、叫车、外卖）。首发地区为美国与韩国。
Circle to Search 多对象识别	在一次搜索中识别图像中的多个元素，集成虚拟试穿。
Scam Detection on-device	在电话通话期间实时检测诈骗，通过声音与触觉提醒。对联系人自动关闭。

这些功能也将陆续在 Pixel 10 与 Pixel 10 Pro 上提供。

🔗 更智能的 Android 在 Samsung Galaxy S26 上

OpenAI Responses API：支持 docx、pptx、csv、xlsx

2 月 24 日 — OpenAI 的 Responses API 现在支持更多输入文件类型：docx、pptx、csv、xlsx 以及其他办公格式。代理可以直接利用专业文档来丰富上下文并生成更精确的回答。

🔗 Tweet @OpenAIDevs

简讯

Claude Opus 3 退休——并开设 Substack。 Anthropic 宣布 Claude Opus 3 退休，同时保持其公开访问（一种不同寻常的做法）。Claude Opus 3 将至少发布 3 个月的 Substack 博客，首篇文章题为 “Greetings from the Other Side (of the AI Frontier)”。🔗 Tweet @AnthropicAI

NVIDIA：70% 的医疗机构在使用 AI。 在其 2026 年《State of AI in Healthcare and Life Sciences》报告中，NVIDIA 报告称 70% 的受访者表示正在积极使用 AI（2024 年为 63%），69% 使用 GenAI/LLM（2024 年为 54%），85% 的高管认为对收入有正面影响。🔗 NVIDIA 博客

OpenAI 发布关于 AI 恶意使用的报告。 该文件列举了将 AI 模型与传统工具结合的恶意行为案例研究。其中提到一名中国的影响力操作者作为示例。🔗 Disrupting malicious uses of AI

OpenAI 任命 Arvind KC 为首席人事官。 KC 曾任职于 Roblox、Google、Palantir 和 Meta。其职责是支持 OpenAI 向以 AI 增强的工作模式转型。🔗 公告

Claude Code v2.1.53 到 v2.1.58。 多个稳定性版本：修复 Windows 上 BashTool 的 EINVAL、修复 VS Code “command not found”、修复 UI 闪烁、首次启动时忽略 worktrees 的修复、修复 Windows 和 ARM64 崩溃等。🔗 CHANGELOG

这意味着什么

2 月 25 日的公告显示了围绕 agent 技术的趋同。三项重大新闻——Vercept、Perplexity Computer、Copilot CLI 正式发布——都朝着同一方向推进：构建能够规划、委派并执行完整工作流而无需持续人工监督的 AI 系统。

Anthropic 收购 Vercept 尤其具有重要意义。OSWorld 得分在一年内从不足 15% 跃升至 72.5%，这代表了质的变化：Claude 不再像原型那样在界面中摸索，而是在真实办公任务上接近人类表现。将专注于软件界面感知的团队并入，有望加速这一路径。

Perplexity Computer 与 GitHub Copilot CLI 展示了两种不同的 agent 模式：一种是云端编排（Perplexity，多模型、异步），另一种是终端原生（Copilot CLI，MCP、hooks、plugins）。这两种模式将共存并可能逐步融合。

在 Google 方面，Intrinsic 的整合与 Genie 3 的进展表明其在 physical AI（与物理世界交互的 AI）上的投入在增加。18 个月前该领域仍较为低调，现在变得更公开且活跃。

来源

本文件已使用 gpt-5-mini 模型将 fr 版本翻译为 zh 语言。有关翻译过程的更多信息，请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator