Perplexity Computer 进入稳定提速阶段，Together AI 免费提供 GLM-5.2，代理式代码工具

2026年6月21日这个周末汇聚了两条不同的主线：一方面，Perplexity Computer 通过集成 Deep Research 和工作流中的新导航工具，进一步提升了深度；另一方面，Together AI 在让 GLM-5.2 免费可用的同时，也将自己确立为 OpenRouter 上该模型最快的推理提供商。在代码工具方面，Amp 显著改进了其子代理 Librarian，并引入了 Custom Agents；与此同时，v0 通过 Annotations 模式简化了用户反馈。

Perplexity Computer — 集成 Deep Research、command panel 与 forking

6月19日 — Perplexity 发布了对 Computer 的重大更新，Computer 是其研究代理平台。最主要的新功能是：Deep Research 现在可以直接在 Computer 工作流中使用。深度研究的结果可以转换为报告、电子表格、演示文稿、仪表盘、网站或工作流——无需离开环境。Perplexity 表示，Computer 中的 Deep Research 凭借一套名为“Search as Code”的基础设施，在最新基准测试中超越了竞争对手。

功能	描述
Computer 中的 Deep Research	可在同一工作流中将深度研究转换为报告、电子表格、仪表盘或工作流
Command panel	通过 `/` 在搜索框中快速访问所有模式和技能
Forking	将一个工作流分叉到新的问题，同时保留完整上下文
Inline actions	直接在搜索框中浮现确认、澄清和连接
Computer Analytics API	以时间序列方式获取使用情况（积分、制品、工作流、时长）——Enterprise
Custom credit limits	管理员可按成员或团队定义信用额度上限——Enterprise

可通过 / 访问的 command panel 将所有可用的模式和技能（Deep Research、Plan Mode、自定义技能、组织技能）集中在一个地方。Forking 允许你在单独的工作流中探索后续问题，同时保留对原始工作流上下文和制品的访问——这是一种在复杂项目迭代过程中非常有用的无回归机制。

Analytics API 和 custom credit limits 面向组织：管理员现在可以通过 API 监控 Computer 的使用情况（兼容 Snowflake、Hex、Metabase 或电子表格），并按角色或团队定义信用额度配额。

🔗 Perplexity 更新日志——Deep Research、command panel、forking

Together AI 免费部署 GLM-5.2，并在 OpenRouter 上占据领先

6月21日 — Together AI 宣布在其平台上部署 GLM-5.2（由 Z.ai / Zhipu 以 MIT 许可证发布的开源模型），可通过 Together Chat 免费使用，无需 API 配置。该模型运行在安全的北美基础设施上。

模型	发布方	许可证	Together AI 访问方式
GLM-5.2	Z.ai (Zhipu)	MIT（开源）	免费——Together Chat，无需 API 设置

与此同时，Together AI 表示自己是 OpenRouter 上 GLM-5.2 最快的推理提供商，并针对长上下文工作负载（编码、代理）进行了优化，以在保持低延迟的同时最大化每个 GPU 的 token 产出。

“Everyone’s trying to find where to test GLM-5.2. You can try it free on Together Chat (link below). No API setup. Just pick GLM-5.2 and start prompting. Served by Together AI on secure North American infrastructure.”

🇨🇳 “每个人都在找哪里可以测试 GLM-5.2。你可以在 Together Chat 上免费试用它（见下方链接）。无需 API 配置。只需选择 GLM-5.2 并开始使用即可。由 Together AI 在安全的北美基础设施上提供服务。” — @togethercompute

🔗 Together AI——OpenRouter 上最快的 GLM-5.2 服务器

AI 代码工具 — Amp 加速 Librarian 并推出 Custom Agents，v0 引入 Annotations

Amp — Librarian 快 3 倍，便宜 43%

6月18日 — Amp 改进了其专注于 GitHub 代码搜索的子代理 Librarian。新版本比上一版大约 快 3 倍，便宜 43%。

指标	变化
速度	~快 3 倍
成本	−43%

Librarian 是 Amp 的内部代理，负责遍历大型代码库以定位符号、函数或模式。此次性能改进可直接惠及那些经常需要代码搜索的工作流。

🔗 Amp——更快的 Librarian

Amp — Custom Agents：插件可以创建并驱动代理

6月19日 — Amp 将其插件系统扩展为 Custom Agents：插件现在可以创建代理、执行代理，并继续与其对话线程交互。此功能使得可以直接从插件中组合专用代理，而无需额外基础设施。

其实用价值在于代理式流水线的组合：一个插件可以触发一个专门负责某项任务的代理（代码审查、测试生成、依赖分析），并在同一工作流中获取结果。编排插件与执行代理之间的分工仍然是显式的。

🔗 Amp——Custom Agents

v0 — Annotations 模式、表单内问题、Apple/Google Pay

6月19日 — v0（Vercel 的界面生成平台）发布了多项新功能。

功能	描述
Annotations 模式	点击预览中的元素即可添加编号评论，并批量发送给代理
表单内问题	v0 的澄清问题会出现在提示词表单中（单选、多选或 skip）
Apple Pay / Google Pay	可在 v0 结账流程中使用
无限收藏	取消 5 个收藏的限制
ZIP 下载	只读成员可以将聊天中的代码下载为 ZIP

Annotations 模式 是最值得注意的新功能：用户不再需要用自然语言去描述视觉问题，而是直接点击预览中的元素并留下编号评论——所有评论都会批量发送给代理。这种方法减少了文本描述与真实意图之间的歧义。

🔗 v0 更新日志

简讯

Claude Code v2.1.185（6月20日）— 网络变慢时显示的等待消息被重新表述为：“等待 API 响应 · 将在……后重试” 取代 “API 无响应 · 正在重试……”。触发延迟从 10 秒改为 20 秒。🔗 更新日志

这意味着什么

开发者的代理式工具链正变得更具可组合性。 Amp 的 Custom Agents 体现了一种长期趋势：AI 开发环境不再满足于把一个 LLM 塞进编辑器里，而是提供可让插件编排专用代理的原语。Custom Agents 提供的编排器/执行器分离，与正在生产流水线中普及的多代理架构相吻合——但这种能力被下放到了插件层面，无需部署基础设施。Librarian 的更新（3×、−43%）说明，这一层专用代理可以独立于主模型进行优化。

开源模型的推理竞赛正在加速。 Together AI 积极宣传自己是 OpenRouter 上 GLM-5.2 最快服务器，这说明推理性能正在成为云端机器学习提供商之间的重要差异化商业卖点。通过 Together Chat 免费提供 GLM-5.2 且无需配置，是一种获客策略：一旦开发者通过聊天界面熟悉了该模型，转向付费 API 的路径就会更直接。这是 HuggingFace 和 Replicate 在早期开源模型上成功采用过的一种模式。

研究型代理平台正在增加企业级控制层。 Perplexity Computer 的新功能（Analytics API、按成员信用额度、forking）显示出这些工具在组织层面采用上的成熟度：企业需要成本控制、使用可追踪性，以及在迭代过程中的无回归保障。Forking 尤其值得关注——它是一种上下文管理原语，在早期 AI 研究工具中并不存在，而它让这些平台更接近协作式工作环境（Git 分支、独立讨论线程）。