Cursor 登陆 iOS、Devin Fusion 成本降 35%、Meta 直接从大脑解码文本

2026 年 6 月 29 日这一天，三项重大公告占据焦点：Cursor 推出其 iOS 应用，可远程操控云端代理；Cognition 发布 Devin Fusion——一种混合式 harness，在成本降低 35% 的同时仍保持前沿级性能；Meta 则在 Nature Neuroscience 上发表 Brain2Qwerty v2，这是一种非侵入式脑到文本接口，准确率达到 61%。在可用性方面，Claude Opus 4.8 新增了两项集成：在 Azure 上的 Microsoft Foundry 中正式可用，以及在 GitHub Copilot 中提供 fast mode 预览版。

Cursor 登陆 iPhone——云端代理与远程控制

6 月 29 日——Cursor（Anysphere）推出一款可在 App Store 下载的原生 iOS 应用。该应用基于两种主要模式：

始终在线的云端代理——启动在后台运行的代理，并可随时从 iPhone 上监督它们，无论身在何处。
远程控制——通过移动应用操控正在自己电脑上运行的代理。

上手体验充分利用了 iOS 的 Live Activities：当某个代理完成任务或请求确认时，应用会发送实时通知。用户还可以直接在手机上查看演示、检查 diffs，并批准或拒绝 pull requests。

在发布初期，Cursor 在应用内提供 Composer 2.5 享受 −75% 折扣，截止到 2026 年 7 月 5 日。

此次发布发生之时，Cursor——由 Anysphere 开发——正处于被 SpaceX/xAI 收购的过程中（预计于 2026 年第三季度完成，品牌将保留）。这款 iOS 应用标志着在始终在线代理背景下向移动优先开发的转向。发布推文在数小时内就获得了 230 万次浏览。

🔗 @cursor_ai 推文

Devin Fusion——以混合架构实现前沿级性能，成本降低 35%

6 月 29 日——Cognition 发布 Devin Fusion，这是一种多模型 harness，在 FrontierCode Extended 基准上，相比仅使用 Opus 4.8 可将成本降低 35%，同时保持前沿级智能。

配置	分数	平均成本 / 任务
Fusion + Fable 5 ¹	57,6	$3,00
Fable 5 单独使用 ¹	57,0	$5,12
Opus 4.8（high）	48,8	$3,24
Fusion	47,9	$2,38
GPT-5.5（high）	44,8	$3,64
GLM-5.2	43,0	$2,70

¹ Fable 5 自 2026 年 6 月 12 日起根据美国政府指令暂停；这些结果基于暂停前的测量。

架构： “Sidekick” 方法

Fusion 的独特之处在于两个代理并行执行：

主代理——负责关键决策的前沿模型（规划、歧义解释、最终审查）。
sidekick 代理——更经济的模型，执行机械性和重复性任务。

这种方法与传统模型路由器有三点不同：它保留了真实的前沿智能（而不仅仅是在基准上），可用于多轮任务，并且通过让每个代理维持自己缓存的上下文，避免了昂贵的 cache misses。动态路由会在 上下文压缩 时触发——此时 cache miss 无论如何都不可避免——因此在缓存成本方面，代理之间的切换几乎是免费的。

在 Cognition 的内部使用中，88% 的 pull requests 都由 Fusion 全程驱动。在 Fable 5 暂停之前，Fusion + Fable 5 相比单独使用 Fable 5 可降低 41% 的成本。

预览版可在 app.devin.ai 获取。

🔗 Cognition 博客——Devin Fusion

Meta Brain2Qwerty v2——无需手术即可达到 61% 的词级准确率，代码开源

6 月 29 日——Meta AI 发布 Brain2Qwerty v2，这是一种非侵入式的脑到文本（brain-computer interface）接口，在无需脑部手术的情况下实现了已发表过的最高解码准确率。研究论文发表于 Nature Neuroscience。

方法	词级准确率（word accuracy）
先前的非侵入式方法（baseline）	8 %
Brain2Qwerty v2——9 名参与者平均值	61 %
Brain2Qwerty v2——最佳参与者	78 %

该系统使用一个非侵入式的 MEG（magnétoencéphalographie）头盔，并结合对原始脑信号进行端到端 deep learning 的网络，随后再由一个经过微调（fine-tuned）的大语言模型处理语义上下文。模型在约 22,000 句由 9 名参与者生成的句子上训练而成，每位参与者佩戴头盔 10 小时。准确率会随着数据量的增加而呈线性对数式提升，这表明仅凭数据规模，未来有望与侵入式方法趋于收敛。

对最佳参与者而言，被解码句子中有一半的词错误不超过 1 个。

已开源发布的资源：

v1 和 v2 的完整训练代码
通过合作伙伴 BCBL（Basque Center on Cognition, Brain and Language）提供的 v1 数据集
相关基础模型：Tribev2、NeuralSet、NeuralBench

这项研究属于 Meta 的 Digital Brain Project，其中包括一个用于开放脑数据集的 500 万美元基金。目标是让数百万有运动或神经损伤的人无需双手、无需外科手术即可书写。

🔗 @AIatMeta 推文

Claude：Azure Foundry 正式可用，Copilot 中提供 fast mode 预览版

Claude in Microsoft Foundry——正式可用

6 月 29 日——Claude Opus 4.8 和 Claude Haiku 4.5 现已在托管于 Azure 的 Microsoft Foundry 中正式可用（general availability）。该集成支持 prompt caching 和 extended thinking。提供两种部署模式：部署在客户的 Azure 环境中，或由 Anthropic 在 Azure 上托管。推理运行在 Azure 基础设施上，并依托现有的 Azure 身份、网络和合规能力。其他模型与能力也被宣布即将推出。

🔗 Anthropic 公告

Claude Opus 4.8 fast mode——GitHub Copilot 预览版

6 月 29 日——Claude Opus 4.8 的 fast mode 正在 GitHub Copilot 中以渐进式预览形式部署。该模式在保留标准模型能力的同时，提供显著更高的 token 生成速度，特别适合交互式编码和以响应性为优先的 agentic 工作流。

**可用性：**Copilot Pro+、Max、Business 和 Enterprise——可用于 VS Code、Visual Studio、Copilot CLI、GitHub Copilot cloud agent、github.com、GitHub Mobile（iOS 和 Android）、JetBrains、Xcode 和 Eclipse。逐步推出中。

**启用方式：**对于 Enterprise 和 Business 方案，管理员需要在 Copilot 设置中启用专用策略（默认关闭）。计费按供应商公开价格通过 Usage Based Billing 结算。

🔗 GitHub Changelog

Warp：Spec Agent 在实现前生成规格说明

6 月 29 日——Zach Lloyd（Warp 首席执行官）发布了其 “cloud software factory” 系列的第二篇文章。在 Triage Agent（6 月 25 日）之后，这篇文章介绍了面向复杂或含糊 issue 设计的 Spec Agent。

当 Triage Agent 识别出一个复杂或属于 roadmap 的 issue 时，它会在任何实现之前将其传递给 Spec Agent。更新后的流程如下：

Issue → Triage Agent
  ├── Issue simple → "ready-to-implement" → Implementation Agent
  ├── Issue complexe → "ready-to-spec" → Spec Agent → Implementation Agent
  ├── Issue ambiguë → "needs-info"
  └── Hors scope → "wait-to-implement"

Spec Agent 会在仓库中生成两个版本化文档，存放于 specs/<issue-number>/ 下：

PRODUCT.md——预期的产品行为
TECH.md——技术架构与代码形态

完整演示已开源发布。文中还预告了第三篇关于 Verification Agent 的文章。

🔗 Warp 博客

Gemini：免费个性化图片与 Meet 记笔记

美国地区免费个性化图片

6 月 29 日——Google 在 Gemini 应用中将 Personal Intelligence、Nano Banana 和 Google Photos 连接起来，用于实现深度个性化的图像生成。自 6 月 29 日起面向美国所有符合条件的用户免费开放。

用户可以输入类似 “design my dream house” 的简单提示词，Gemini 会自动从 Google Photos 中提取图片来个性化结果。Google 应用的连接仍然是可选的（opt-in），可在设置中配置。此前，个性化需要手动上传照片并详细描述提示词。

🔗 Google 公告

Gemini 在 Google Meet 中自动记笔记

6 月 29 日——Gemini 现已可在 Google Meet 中自动记笔记，面向 Google AI Pro 和 Ultra 订阅用户。该功能原生集成于 Meet 中，会议期间无需手动操作。

🔗 Google Workspace 博客

Runway × MIXI——日本战略性企业合作

6 月 29 日——Runway 宣布与 MIXI 建立战略合作伙伴关系。MIXI 是日本数字娱乐领域的领导者（Monster Strike：6500 万用户，FamilyAlbum：3000 万用户）。MIXI 正在其游戏、体育和娱乐部门以企业级规模部署 Runway。

任务	使用 Runway 前	使用 Runway 后
Monster Strike 宣传视频	21 天	3 天
混合品牌影片（实拍 + 生成式）	20 天	7 天
动画视觉提案	数天	约 5 分钟

该合作是 Runway 在日本扩张的一部分：已开设东京办公室，投入 4000 万美元，企业业务 12 个月增长 +300%——位列美国和欧洲之后的全球第三大市场。提及的其他日本合作伙伴包括：Yamaha、SoftBank Corp.、NHN PlayArt。

🔗 Runway 公告

Codex——速率限制储值、浏览器提速 2 倍、桌面端体验优化

6 月 29 日——Codex 更新日志带来了多项改进，涵盖使用限制管理、内置浏览器性能以及桌面体验。

Rate-limit reset banking（Plus 和 Pro）——OpenAI 为速率限制重置（rate-limit reset）引入了储值系统。启动时赠送一次免费重置，并提供推荐计划以积累更多次数。Business 订阅用户可以邀请同事，在工作区内生成共享积分。

Browser use 速度提升 2 倍——得益于对 CDP（Chrome DevTools Protocol）和 DOM 快照的优化，内置浏览器如今最高快了两倍，减少了与浏览器之间的往返次数。

桌面端 QOL——可自定义的 macOS Dock 图标（浅色/深色变体）、Windows 上 Computer Use 的应用级访问控制、命令菜单中的 “Unread chats” 标签页并默认选中最近对话，以及改进的插件管理：支持工作区插件、安装或移除后状态可可靠刷新、共享插件可在不更改其访问权限的情况下发布新版本。

🔗 Codex Changelog

简讯

Sakana AI Fugu 在 Gemini Enterprise Agent Platform 上（6 月 29 日）——Sakana AI 在 Google Cloud Japan 博客上发布访谈文章，解释团队为何将 Gemini Enterprise Agent Platform 全面采用为 Fugu 的服务基础设施。Fugu 自 2025 年 10 月开始开发，在 Google 团队支持下约 6 个月进入生产。🔗 @SakanaAILabs 推文
Ai2——DiScoFormer（6 月 29 日）——Allen Institute for AI 发布 DiScoFormer，这是一个统一的 transformer，在一次前向传播中同时估计 density 和 score（density and score estimator），无需重新训练即可泛化到训练分布之外（out-of-distribution）的数据分布。将经典 KDE 推广到了高维场景。🔗 Ai2 Research
Gemini CLI v0.51.0-nightly（6 月 28-29 日）——nightly 构建带来了对敏感路径黑名单的安全修复（现已区分大小写不敏感）以及 vscode hitl 行为的修正。稳定版仍为 v0.49.0。🔗 GitHub Releases
GitHub——将 issues 创建限制为仅协作者（6 月 29 日）——GitHub 现已允许将 issue 创建限制为仓库协作者，适用于减少公共仓库中的垃圾信息和越界贡献。🔗 GitHub Changelog
OpenAI × HP——Frontier 合作伙伴关系（6 月 28 日）——OpenAI 发布文章，介绍在 Frontier 合作伙伴关系框架下，ChatGPT Enterprise 和 GPT API 在 HP 企业级规模部署的情况，以及它们在运营和团队生产力方面的用例。🔗 OpenAI 公告

这意味着什么

开发工具正在变得移动化并具备编排能力。 Cursor 登陆 iOS 表明，对智能体的监督不再局限于办公室：开发者将能够在手机上执行任务、批准拉取请求并接收实时提醒。Devin Fusion 更进一步，展示了前沿级性能不再需要单体模型——一种并行双智能体架构以低 35% 的成本交付了可比质量。移动性 + 多模型编排的组合，正在勾勒下一代开发环境。

Claude 正在部署到企业工程团队最常用的两套基础设施中。 在 Microsoft Foundry 的正式可用，以及在 GitHub Copilot 中的 fast mode 预览，体现了一种广泛分发的策略：Opus 4.8 现已可在 Azure 上使用（并支持 prompt caching 和 extended thinking，以满足合规要求），也可在 Copilot 中使用（为交互式编码提供更快的生成速度）。这两项集成分别满足不同需求——一项面向主权基础设施，另一项面向响应速度——并覆盖了企业市场的大部分场景。

AI 在神经科学领域跨越了一道门槛。 Brain2Qwerty v2 在不进行脑部手术的情况下，将准确率从 8% 提升到 61%——在非侵入式系统上实现了 7.6 倍提升。随着数据增加呈现的对数线性进展，预示着未来有望与侵入式方案收敛到接近水平。代码、数据集和基础模型的开源发布释放出强烈信号：Meta 将这项技术定位为脑机接口研究的开放基础设施，并投入 500 万美元资金以加速数据集创建。数百万存在运动或神经损伤的人群，正是这项工作的目标对象。

创意经济正在亚洲走向工业化。 Runway 和 MIXI 表明，缩短制作周期（宣传视频从 21 天降至 3 天）正在重塑日本创意工作室的经济结构。随着企业业务在 12 个月内增长 300% 以上，以及在日本市场投入 4000 万美元，Runway 正在押注地理扩张，而生产约束（高成本、动画与游戏的长周期）最为明显的地方，正是其发力重点。日本正成为 Runway 的全球第三大市场。