搜索

Anthropic 收购 Vercept(computer use 在 OSWorld 达到 72.5%)、Perplexity Computer 协调 19 个模型、GitHub Copilot CLI 正式发布

Anthropic 收购 Vercept(computer use 在 OSWorld 达到 72.5%)、Perplexity Computer 协调 19 个模型、GitHub Copilot CLI 正式发布

2026 年 2 月 25 日是信息密集的一天:Anthropic 收购 Vercept 以加速 Claude 的 computer use 能力(在 OSWorld 达到 72.5%),Perplexity 推出 Computer——一个并行协调 19 个模型的多模型 agent 系统——同时 GitHub Copilot CLI 对所有付费订阅用户正式可用。与此并行,Google DeepMind 发布了 Genie 3(交互式 world models),Intrinsic 并入 Google,从事工业机器人相关工作。


Anthropic 收购 Vercept:computer use 在 OSWorld 上升到 72.5%

2 月 25 日 — Anthropic 宣布收购专注于感知与软件界面交互的初创公司 Vercept。联合创始人 Kiana Ehsani、Luca Weihs 和 Ross Girshick 将加入 Anthropic,直接强化 Claude 的 computer use 能力。

此项收购反映在快速提升的基准测试 OSWorld 上,该基准评估 AI 代理在真实操作系统上完成任务的能力(在复杂表格中导航、填写多标签表单等):

时期OSWorld 得分
2024 年底(computer use 启动时)< 15%
Claude Sonnet 4.6(2026 年 2 月)72.5%

一年内提升超过 57 个点。Claude Sonnet 4.6 在这些办公任务上的表现已接近人类水平。Vercept 将在未来几周内停止对外产品,把全部精力集中在 Anthropic 内部的这项工作。

这起收购延续了此前对 Bun 的收购。Anthropic 正在构建一个由多支技术精英团队组成的产品组合,以增强其 agent 能力。

🔗 Anthropic 收购 Vercept


Perplexity Computer:一个多模型的 agent 协调器(19 个模型)

2 月 25 日 — Perplexity 推出 Computer,这是一个通用的 AI 系统,旨在端到端 执行完整项目。用户描述最终目标,Computer 将把工作拆分为子任务,创建专门的子代理(sub-agents),并行执行——如果需要可持续数小时或数月。

该系统的运行是异步且隔离的:每个任务在独立环境中执行,拥有对真实文件系统、真实浏览器以及真实工具集成(APIs、网络检索、文档生成)的访问权限。

Perplexity Computer 的区别在于其“massively multi-model”级别的编排——提供 19 个模型,每个模型根据其擅长领域被分配任务:

模型角色
Claude Opus 4.6主要编排器(核心推理)
Gemini深度研究,创建子代理
ChatGPT 5.2长上下文回溯与广泛搜索
Grok轻量任务(速度)
Veo 3.1视频生成
Nano Banana图像生成

这个 harness 是 model-agnostic:模型可随着演进被替换。Perplexity 的理念是模型应当专业化而非商品化,使得多模型编排比单一模型更高效。

可用性: 当前通过 Web 对 Perplexity Max 订阅用户开放。将向 Perplexity Pro、Enterprise 和 Enterprise Max 分阶段部署。定价基于使用量并可配置消费上限。

🔗 介绍 Perplexity Computer


GitHub Copilot CLI 正式发布

2 月 25 日 — 在 2025 年 9 月公开预览后,GitHub Copilot CLI 现已对所有 Copilot 付费订阅用户(Pro、Pro+、Business、Enterprise)正式可用。自预览以来已有数百项改进。

Copilot CLI 现在是一个从终端运行的完整 agent 开发环境:

功能细节
Plan mode(Shift+Tab)分析请求、提出澄清问题、在写码前构建结构化计划
Autopilot mode端到端的自主执行,无需中断
Background delegation前缀 & → 将工作委派到云端 agent,释放终端;使用 /resume 恢复
Multi-modèleClaude Opus 4.6、Claude Sonnet 4.6、Claude Haiku 4.5、GPT-5.3-Codex、Gemini 3 Pro
MCP intégré内置 GitHub MCP server + 支持自定义 MCP
Plugins/plugin install owner/repo — 打包 MCP、agents、skills、hooks
Agent SkillsMarkdown 文件 → 专门化工作流,可与 Copilot agent 和 VS Code 共享
Agents custom通过向导或 .agent.md 文件创建
Hooks使用 preToolUse / postToolUse 进行策略与后处理
Auto-compaction自动将上下文压缩至 95% → 实现无限会话
Repository memory在会话间记住约定与惯例

对于 Business 与 Enterprise 组织:管理员需在 Policies 页面启用 Copilot CLI。

🔗 GitHub Copilot CLI 现已正式发布


Claude Cowork:计划任务、Customize 选项卡,Windows 可用

2 月 25 日 — Anthropic 宣布对 Claude Cowork(research preview)增加多项功能:

功能细节
Scheduled tasksClaude 自动执行定期任务(晨间简报、每周表格更新、周五展示等)
Customize 选项卡侧边栏中新选项卡,用于从一个位置管理 plugins、skills 和连接器
Expansion WindowsCowork 现已在 macOS 与 Windows 可用(适用于所有 Claude 付费计划)

Cowork 可访问本地文件、连接器(Slack、Notion、Figma)以及用于网页导航的 Claude in Chrome。

🔗 线程 @claudeai


Google DeepMind — Genie 3:交互式的 world models

2 月 25 日 — Google DeepMind 发布了与 Project Genie 联合负责人的一次问答,介绍其实验性 prototype 的 world model。借助 Genie 3,一张静态图片或一段文字就能生成一个可实时交互并可导航的环境——无需游戏引擎。

与 LLM 的概念性差异在于:LLM 预测下一个词,而 world model 预测环境在代理动作下会发生什么。Genie 3 能逐时刻模拟完整空间,并考虑物理属性(弹跳、反射、降雨等)。

设想的应用包括:在安全模拟环境中训练代理、沉浸式教育(探索古罗马)、游戏与电影的原型制作。

Project Genie 在美国对 Google AI Ultra 订阅用户开放(18+)。

🔗 什么是 world model?


Intrinsic 并入 Google——工业机器人与 physical AI

2 月 25 日 — Alphabet 宣布其“Other Bets” 旗下公司 Intrinsic(成立于 2021 年)并入 Google。Intrinsic 开发由 AI 驱动的工业机器人平台——用于构建、部署和管理复杂机器人应用的工具集。

此次并入 Google 的目的是加速 physical AI 的发展,即将 AI 应用于物理世界。该交易将使 Intrinsic 能够利用 Google 的 AI 资源,帮助工业企业更快适应变革。

🔗 Intrinsic 并入 Google


Codex CLI v0.105.0:语法高亮、语音听写、多代理 CSV

~2 月 25 日 — OpenAI 的 Codex CLI 发布了重要新版:

功能描述
Syntax highlightingTUI 中的语法高亮、彩色 diff、主题选择器 /theme 并支持实时预览
Dictée vocale长按空格键进行录音并转录指令
spawn_agents_on_csv从 CSV 发起的多代理 fan-out,带进度和 ETA 跟踪
/copy复制最后一次的完整回复
/clear / Ctrl-L清屏但不丢失线程上下文
细粒度审批可针对提示类型选择性拒绝,而非禁用所有审批
npm install -g @openai/codex@0.105.0

🔗 Codex 更新日志


Samsung Galaxy S26:Gemini 多步任务与设备端诈骗检测

2 月 25 日 — 在 Galaxy Unpacked 2026 活动中,Google 与 Samsung 宣布了三项在 Galaxy S26 上由 Gemini 3 系列模型提供支持的新功能:

功能细节
Gemini multi-step tasks(测试版)长按侧键 → Gemini 在后台委派(购物、叫车、外卖)。首发地区为美国与韩国。
Circle to Search 多对象识别在一次搜索中识别图像中的多个元素,集成虚拟试穿。
Scam Detection on-device在电话通话期间实时检测诈骗,通过声音与触觉提醒。对联系人自动关闭。

这些功能也将陆续在 Pixel 10 与 Pixel 10 Pro 上提供。

🔗 更智能的 Android 在 Samsung Galaxy S26 上


OpenAI Responses API:支持 docx、pptx、csv、xlsx

2 月 24 日 — OpenAI 的 Responses API 现在支持更多输入文件类型:docxpptxcsvxlsx 以及其他办公格式。代理可以直接利用专业文档来丰富上下文并生成更精确的回答。

🔗 Tweet @OpenAIDevs


简讯

Claude Opus 3 退休——并开设 Substack。 Anthropic 宣布 Claude Opus 3 退休,同时保持其公开访问(一种不同寻常的做法)。Claude Opus 3 将至少发布 3 个月的 Substack 博客,首篇文章题为 “Greetings from the Other Side (of the AI Frontier)”。🔗 Tweet @AnthropicAI

NVIDIA:70% 的医疗机构在使用 AI。 在其 2026 年《State of AI in Healthcare and Life Sciences》报告中,NVIDIA 报告称 70% 的受访者表示正在积极使用 AI(2024 年为 63%),69% 使用 GenAI/LLM(2024 年为 54%),85% 的高管认为对收入有正面影响。🔗 NVIDIA 博客

OpenAI 发布关于 AI 恶意使用的报告。 该文件列举了将 AI 模型与传统工具结合的恶意行为案例研究。其中提到一名中国的影响力操作者作为示例。🔗 Disrupting malicious uses of AI

OpenAI 任命 Arvind KC 为首席人事官。 KC 曾任职于 Roblox、Google、Palantir 和 Meta。其职责是支持 OpenAI 向以 AI 增强的工作模式转型。🔗 公告

Claude Code v2.1.53 到 v2.1.58。 多个稳定性版本:修复 Windows 上 BashTool 的 EINVAL、修复 VS Code “command not found”、修复 UI 闪烁、首次启动时忽略 worktrees 的修复、修复 Windows 和 ARM64 崩溃等。🔗 CHANGELOG


这意味着什么

2 月 25 日的公告显示了围绕 agent 技术的趋同。三项重大新闻——Vercept、Perplexity Computer、Copilot CLI 正式发布——都朝着同一方向推进:构建能够规划、委派并执行完整工作流而无需持续人工监督的 AI 系统。

Anthropic 收购 Vercept 尤其具有重要意义。OSWorld 得分在一年内从不足 15% 跃升至 72.5%,这代表了质的变化:Claude 不再像原型那样在界面中摸索,而是在真实办公任务上接近人类表现。将专注于软件界面感知的团队并入,有望加速这一路径。

Perplexity Computer 与 GitHub Copilot CLI 展示了两种不同的 agent 模式:一种是云端编排(Perplexity,多模型、异步),另一种是终端原生(Copilot CLI,MCP、hooks、plugins)。这两种模式将共存并可能逐步融合。

在 Google 方面,Intrinsic 的整合与 Genie 3 的进展表明其在 physical AI(与物理世界交互的 AI)上的投入在增加。18 个月前该领域仍较为低调,现在变得更公开且活跃。


来源

本文件已使用 gpt-5-mini 模型将 fr 版本翻译为 zh 语言。有关翻译过程的更多信息,请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator