搜索

Cursor 登陆 iOS、Devin Fusion 成本降 35%、Meta 直接从大脑解码文本

Cursor 登陆 iOS、Devin Fusion 成本降 35%、Meta 直接从大脑解码文本

ai-powered-markdown-translator

由 gpt-5.4-mini 从法语翻译成中文的文章。

在 GitHub 上查看项目 ↗

2026 年 6 月 29 日这一天,三项重大公告占据焦点:Cursor 推出其 iOS 应用,可远程操控云端代理;Cognition 发布 Devin Fusion——一种混合式 harness,在成本降低 35% 的同时仍保持前沿级性能;Meta 则在 Nature Neuroscience 上发表 Brain2Qwerty v2,这是一种非侵入式脑到文本接口,准确率达到 61%。在可用性方面,Claude Opus 4.8 新增了两项集成:在 Azure 上的 Microsoft Foundry 中正式可用,以及在 GitHub Copilot 中提供 fast mode 预览版。


Cursor 登陆 iPhone——云端代理与远程控制

6 月 29 日——Cursor(Anysphere)推出一款可在 App Store 下载的原生 iOS 应用。该应用基于两种主要模式:

  • 始终在线的云端代理——启动在后台运行的代理,并可随时从 iPhone 上监督它们,无论身在何处。
  • 远程控制——通过移动应用操控正在自己电脑上运行的代理。

上手体验充分利用了 iOS 的 Live Activities:当某个代理完成任务或请求确认时,应用会发送实时通知。用户还可以直接在手机上查看演示、检查 diffs,并批准或拒绝 pull requests。

在发布初期,Cursor 在应用内提供 Composer 2.5 享受 −75% 折扣,截止到 2026 年 7 月 5 日。

此次发布发生之时,Cursor——由 Anysphere 开发——正处于被 SpaceX/xAI 收购的过程中(预计于 2026 年第三季度完成,品牌将保留)。这款 iOS 应用标志着在始终在线代理背景下向移动优先开发的转向。发布推文在数小时内就获得了 230 万次浏览。

🔗 @cursor_ai 推文


Devin Fusion——以混合架构实现前沿级性能,成本降低 35%

6 月 29 日——Cognition 发布 Devin Fusion,这是一种多模型 harness,在 FrontierCode Extended 基准上,相比仅使用 Opus 4.8 可将成本降低 35%,同时保持前沿级智能。

配置分数平均成本 / 任务
Fusion + Fable 5 ¹57,6$3,00
Fable 5 单独使用 ¹57,0$5,12
Opus 4.8(high)48,8$3,24
Fusion47,9$2,38
GPT-5.5(high)44,8$3,64
GLM-5.243,0$2,70

¹ Fable 5 自 2026 年 6 月 12 日起根据美国政府指令暂停;这些结果基于暂停前的测量。

架构: “Sidekick” 方法

Fusion 的独特之处在于两个代理并行执行:

  • 主代理——负责关键决策的前沿模型(规划、歧义解释、最终审查)。
  • sidekick 代理——更经济的模型,执行机械性和重复性任务。

这种方法与传统模型路由器有三点不同:它保留了真实的前沿智能(而不仅仅是在基准上),可用于多轮任务,并且通过让每个代理维持自己缓存的上下文,避免了昂贵的 cache misses。动态路由会在 上下文压缩 时触发——此时 cache miss 无论如何都不可避免——因此在缓存成本方面,代理之间的切换几乎是免费的。

在 Cognition 的内部使用中,88% 的 pull requests 都由 Fusion 全程驱动。在 Fable 5 暂停之前,Fusion + Fable 5 相比单独使用 Fable 5 可降低 41% 的成本。

预览版可在 app.devin.ai 获取。

🔗 Cognition 博客——Devin Fusion


Meta Brain2Qwerty v2——无需手术即可达到 61% 的词级准确率,代码开源

6 月 29 日——Meta AI 发布 Brain2Qwerty v2,这是一种非侵入式的脑到文本(brain-computer interface)接口,在无需脑部手术的情况下实现了已发表过的最高解码准确率。研究论文发表于 Nature Neuroscience

方法词级准确率(word accuracy)
先前的非侵入式方法(baseline)8 %
Brain2Qwerty v2——9 名参与者平均值61 %
Brain2Qwerty v2——最佳参与者78 %

该系统使用一个非侵入式的 MEG(magnétoencéphalographie)头盔,并结合对原始脑信号进行端到端 deep learning 的网络,随后再由一个经过微调(fine-tuned)的大语言模型处理语义上下文。模型在约 22,000 句由 9 名参与者生成的句子上训练而成,每位参与者佩戴头盔 10 小时。准确率会随着数据量的增加而呈线性对数式提升,这表明仅凭数据规模,未来有望与侵入式方法趋于收敛。

对最佳参与者而言,被解码句子中有一半的词错误不超过 1 个。

已开源发布的资源:

  • v1 和 v2 的完整训练代码
  • 通过合作伙伴 BCBL(Basque Center on Cognition, Brain and Language)提供的 v1 数据集
  • 相关基础模型:Tribev2、NeuralSet、NeuralBench

这项研究属于 Meta 的 Digital Brain Project,其中包括一个用于开放脑数据集的 500 万美元基金。目标是让数百万有运动或神经损伤的人无需双手、无需外科手术即可书写。

🔗 @AIatMeta 推文


Claude:Azure Foundry 正式可用,Copilot 中提供 fast mode 预览版

Claude in Microsoft Foundry——正式可用

6 月 29 日——Claude Opus 4.8 和 Claude Haiku 4.5 现已在托管于 Azure 的 Microsoft Foundry 中正式可用(general availability)。该集成支持 prompt caching 和 extended thinking。提供两种部署模式:部署在客户的 Azure 环境中,或由 Anthropic 在 Azure 上托管。推理运行在 Azure 基础设施上,并依托现有的 Azure 身份、网络和合规能力。其他模型与能力也被宣布即将推出。

🔗 Anthropic 公告

Claude Opus 4.8 fast mode——GitHub Copilot 预览版

6 月 29 日——Claude Opus 4.8 的 fast mode 正在 GitHub Copilot 中以渐进式预览形式部署。该模式在保留标准模型能力的同时,提供显著更高的 token 生成速度,特别适合交互式编码和以响应性为优先的 agentic 工作流。

**可用性:**Copilot Pro+、Max、Business 和 Enterprise——可用于 VS Code、Visual Studio、Copilot CLI、GitHub Copilot cloud agent、github.com、GitHub Mobile(iOS 和 Android)、JetBrains、Xcode 和 Eclipse。逐步推出中。

**启用方式:**对于 Enterprise 和 Business 方案,管理员需要在 Copilot 设置中启用专用策略(默认关闭)。计费按供应商公开价格通过 Usage Based Billing 结算。

🔗 GitHub Changelog


Warp:Spec Agent 在实现前生成规格说明

6 月 29 日——Zach Lloyd(Warp 首席执行官)发布了其 “cloud software factory” 系列的第二篇文章。在 Triage Agent(6 月 25 日)之后,这篇文章介绍了面向复杂或含糊 issue 设计的 Spec Agent

当 Triage Agent 识别出一个复杂或属于 roadmap 的 issue 时,它会在任何实现之前将其传递给 Spec Agent。更新后的流程如下:

Issue → Triage Agent
  ├── Issue simple → "ready-to-implement" → Implementation Agent
  ├── Issue complexe → "ready-to-spec" → Spec Agent → Implementation Agent
  ├── Issue ambiguë → "needs-info"
  └── Hors scope → "wait-to-implement"

Spec Agent 会在仓库中生成两个版本化文档,存放于 specs/<issue-number>/ 下:

  • PRODUCT.md——预期的产品行为
  • TECH.md——技术架构与代码形态

完整演示已开源发布。文中还预告了第三篇关于 Verification Agent 的文章。

🔗 Warp 博客


Gemini:免费个性化图片与 Meet 记笔记

美国地区免费个性化图片

6 月 29 日——Google 在 Gemini 应用中将 Personal IntelligenceNano BananaGoogle Photos 连接起来,用于实现深度个性化的图像生成。自 6 月 29 日起面向美国所有符合条件的用户免费开放。

用户可以输入类似 “design my dream house” 的简单提示词,Gemini 会自动从 Google Photos 中提取图片来个性化结果。Google 应用的连接仍然是可选的(opt-in),可在设置中配置。此前,个性化需要手动上传照片并详细描述提示词。

🔗 Google 公告

Gemini 在 Google Meet 中自动记笔记

6 月 29 日——Gemini 现已可在 Google Meet 中自动记笔记,面向 Google AI Pro 和 Ultra 订阅用户。该功能原生集成于 Meet 中,会议期间无需手动操作。

🔗 Google Workspace 博客


Runway × MIXI——日本战略性企业合作

6 月 29 日——Runway 宣布与 MIXI 建立战略合作伙伴关系。MIXI 是日本数字娱乐领域的领导者(Monster Strike:6500 万用户,FamilyAlbum:3000 万用户)。MIXI 正在其游戏、体育和娱乐部门以企业级规模部署 Runway。

任务使用 Runway 前使用 Runway 后
Monster Strike 宣传视频21 天3 天
混合品牌影片(实拍 + 生成式)20 天7 天
动画视觉提案数天约 5 分钟

该合作是 Runway 在日本扩张的一部分:已开设东京办公室,投入 4000 万美元,企业业务 12 个月增长 +300%——位列美国和欧洲之后的全球第三大市场。提及的其他日本合作伙伴包括:Yamaha、SoftBank Corp.、NHN PlayArt。

🔗 Runway 公告


Codex——速率限制储值、浏览器提速 2 倍、桌面端体验优化

6 月 29 日——Codex 更新日志带来了多项改进,涵盖使用限制管理、内置浏览器性能以及桌面体验。

Rate-limit reset banking(Plus 和 Pro)——OpenAI 为速率限制重置(rate-limit reset)引入了储值系统。启动时赠送一次免费重置,并提供推荐计划以积累更多次数。Business 订阅用户可以邀请同事,在工作区内生成共享积分。

Browser use 速度提升 2 倍——得益于对 CDP(Chrome DevTools Protocol)和 DOM 快照的优化,内置浏览器如今最高快了两倍,减少了与浏览器之间的往返次数。

桌面端 QOL——可自定义的 macOS Dock 图标(浅色/深色变体)、Windows 上 Computer Use 的应用级访问控制、命令菜单中的 “Unread chats” 标签页并默认选中最近对话,以及改进的插件管理:支持工作区插件、安装或移除后状态可可靠刷新、共享插件可在不更改其访问权限的情况下发布新版本。

🔗 Codex Changelog


简讯

  • Sakana AI Fugu 在 Gemini Enterprise Agent Platform 上6 月 29 日)——Sakana AI 在 Google Cloud Japan 博客上发布访谈文章,解释团队为何将 Gemini Enterprise Agent Platform 全面采用为 Fugu 的服务基础设施。Fugu 自 2025 年 10 月开始开发,在 Google 团队支持下约 6 个月进入生产。🔗 @SakanaAILabs 推文

  • Ai2——DiScoFormer6 月 29 日)——Allen Institute for AI 发布 DiScoFormer,这是一个统一的 transformer,在一次前向传播中同时估计 density 和 score(density and score estimator),无需重新训练即可泛化到训练分布之外(out-of-distribution)的数据分布。将经典 KDE 推广到了高维场景。🔗 Ai2 Research

  • Gemini CLI v0.51.0-nightly6 月 28-29 日)——nightly 构建带来了对敏感路径黑名单的安全修复(现已区分大小写不敏感)以及 vscode hitl 行为的修正。稳定版仍为 v0.49.0。🔗 GitHub Releases

  • GitHub——将 issues 创建限制为仅协作者6 月 29 日)——GitHub 现已允许将 issue 创建限制为仓库协作者,适用于减少公共仓库中的垃圾信息和越界贡献。🔗 GitHub Changelog

  • OpenAI × HP——Frontier 合作伙伴关系6 月 28 日)——OpenAI 发布文章,介绍在 Frontier 合作伙伴关系框架下,ChatGPT Enterprise 和 GPT API 在 HP 企业级规模部署的情况,以及它们在运营和团队生产力方面的用例。🔗 OpenAI 公告


这意味着什么

开发工具正在变得移动化并具备编排能力。 Cursor 登陆 iOS 表明,对智能体的监督不再局限于办公室:开发者将能够在手机上执行任务、批准拉取请求并接收实时提醒。Devin Fusion 更进一步,展示了前沿级性能不再需要单体模型——一种并行双智能体架构以低 35% 的成本交付了可比质量。移动性 + 多模型编排的组合,正在勾勒下一代开发环境。

Claude 正在部署到企业工程团队最常用的两套基础设施中。 在 Microsoft Foundry 的正式可用,以及在 GitHub Copilot 中的 fast mode 预览,体现了一种广泛分发的策略:Opus 4.8 现已可在 Azure 上使用(并支持 prompt caching 和 extended thinking,以满足合规要求),也可在 Copilot 中使用(为交互式编码提供更快的生成速度)。这两项集成分别满足不同需求——一项面向主权基础设施,另一项面向响应速度——并覆盖了企业市场的大部分场景。

AI 在神经科学领域跨越了一道门槛。 Brain2Qwerty v2 在不进行脑部手术的情况下,将准确率从 8% 提升到 61%——在非侵入式系统上实现了 7.6 倍提升。随着数据增加呈现的对数线性进展,预示着未来有望与侵入式方案收敛到接近水平。代码、数据集和基础模型的开源发布释放出强烈信号:Meta 将这项技术定位为脑机接口研究的开放基础设施,并投入 500 万美元资金以加速数据集创建。数百万存在运动或神经损伤的人群,正是这项工作的目标对象。

创意经济正在亚洲走向工业化。 Runway 和 MIXI 表明,缩短制作周期(宣传视频从 21 天降至 3 天)正在重塑日本创意工作室的经济结构。随着企业业务在 12 个月内增长 300% 以上,以及在日本市场投入 4000 万美元,Runway 正在押注地理扩张,而生产约束(高成本、动画与游戏的长周期)最为明显的地方,正是其发力重点。日本正成为 Runway 的全球第三大市场。


来源