ai-powered-markdown-translator使用 gpt-5.4-mini 将文章从法语翻译成中文。
2026年5月11日是信息密集的一天:OpenAI 以 40 亿美元初始投资推出面向企业部署的子公司,Anthropic 让 Claude Platform on AWS 面向所有 AWS 客户开放,而 xAI 则发布了用于实时语音客户支持的 Grok Voice Think Fast 1.0。在工具方面,GitHub Copilot 在组织级机密管理上迈出新一步,Gemini 推出用于个性化旅行规划的 Personal Intelligence,NVIDIA 则发布了 OpenShell v0.0.37。
OpenAI Deployment Company — 40 亿美元企业子公司
5月11日 — OpenAI 推出 OpenAI Deployment Company(简称“DeployCo”),这是一个专门帮助组织将 AI 系统直接集成并部署到关键运营中的实体。这并不是又一项云服务:DeployCo 会派出 Forward Deployed Engineers 直接到客户现场,识别高价值 AI 机会、重新设计工作流,并将其部署到生产环境中。
结构与合作伙伴:
| 类别 | 合作伙伴 |
|---|---|
| 牵头投资方 | TPG |
| 联合创始方 | Advent、Bain Capital、Brookfield |
| 创始合作伙伴 | B Capital、BBVA、Emergence Capital、Goldman Sachs、SoftBank Corp.、Warburg Pincus、WCAS、Goanna |
| 顾问 / 集成 | Bain & Company、Capgemini、McKinsey & Company |
收购 Tomoro: OpenAI 在启动时即整合 Tomoro,这是一家应用 AI 咨询公司,其客户包括 Tesco、Virgin Atlantic 和 Supercell。此次收购带来约 150 名经验丰富的工程师(Forward Deployed Engineers 和 Deployment Specialists)。最终完成仍取决于监管批准。
关键数据: 40 亿美元初始投资,合作伙伴已支持超过 2,000 家企业,超过 100 万家企业已经在使用 OpenAI 产品和 API。DeployCo 由 OpenAI 持有多数股权并控制。
“AI is becoming capable of doing increasingly meaningful work inside organizations. The challenge now is helping companies integrate these systems into the infrastructure and workflows that power their businesses. DeployCo is designed to help organizations bridge that gap and turn AI capability into real operational impact.”
🇨🇳 “AI 正在变得越来越能够在组织内部完成越来越有意义的工作。如今的挑战在于帮助企业把这些系统整合进支撑其业务运转的基础设施和工作流中。DeployCo 的设计初衷,就是帮助组织跨越这道鸿沟,把 AI 的能力转化为真正的运营影响。” — Denise Dresser,OpenAI 首席营收官
Claude Platform on AWS — 正式可用
5月11日 — Anthropic 让 Claude Platform on AWS 正式面向所有 AWS 客户开放。该服务不同于 Amazon Bedrock 上的 Claude:它可直接访问完整的原生 Claude API,并通过 AWS IAM 进行身份验证、通过 CloudTrail 进行日志记录,同时在 AWS 账户中统一计费。
包含功能:
| 功能 | 状态 | 描述 |
|---|---|---|
| Claude Managed Agents | Beta | 大规模构建与部署代理 |
| Advisor strategy | Beta | 通过咨询顾问模型增强代理 |
| Web search + web fetch | GA | 访问实时数据 |
| Code execution | GA | Python、可视化、数据分析 |
| Files API | Beta | 在对话之间上传持久化文档 |
| Skills | Beta | 向 Claude 教授最佳实践 |
| MCP connector | Beta | 无需客户端代码即可连接任意远程 MCP 服务器 |
| Prompt caching | GA | 降低重复上下文的成本 |
| Citations | GA | 将回答锚定到源文档中 |
| Batch processing | GA | 高吞吐量异步工作负载 |
可用模型为 Claude Opus 4.7、Sonnet 4.6 和 Haiku 4.5。新模型将同时在 Claude Platform on AWS 和 Anthropic 直接 API 上发布。
与 Amazon Bedrock 的区别: Bedrock 在 AWS 边界内运行,由 AWS 充当数据处理方——适合对数据驻留有严格要求的企业。Claude Platform on AWS 则通过 AWS 基础设施提供 Claude API 的全部原生功能,而 AWS 仅作为接入层。
可用性: 覆盖大多数 AWS 商业区域,并具备全球与美国合规能力(包括 GovCloud)。
Grok Voice Think Fast 1.0 — 面向客户支持的实时语音代理
5月8日 — xAI 推出 Grok Voice Think Fast 1.0,这是一款面向生产环境客户支持设计的语音代理。其定位非常明确:一个“为真实世界打造”的语音代理,能够与最终用户进行实时对话——不仅仅是内部演示。该公告在 3 天内在 X 上累计获得 7,000 万次浏览,显示出市场的强烈兴趣。
公告描述了一个能够处理典型客户支持语音场景的代理:产品问题、故障排查、升级转接。其“Think Fast”定位暗示着一种针对低延迟优化的架构——这对于生产环境语音部署至关重要,因为任何超过 500 毫秒的停顿都会降低用户体验。
市场背景: Grok Voice Think Fast 1.0 的发布,正值客户支持语音代理竞赛之中。OpenAI 已于 5 月 7 日发布 GPT-Realtime-2(已在 5 月 10 日文章中报道)。ElevenLabs 正在为 Mahindra 的汽车发布会部署语音代理(参见简讯)。如今每一家主要厂商都在推出企业级语音代理方案。
可用性: 可通过 xAI API 访问。公告中未披露定价。
🔗 @xai 推文
Gemini Personal Intelligence — 定制旅行行程
5月11日 — Gemini 推出 Personal Intelligence,这是一项将 Gemini 应用连接到用户个人数据的功能,用于创建完全个性化的旅行行程。可用的数据来源包括:Gmail(旅行历史、预订确认)、Google Photos(去过的目的地)、Google Search(搜索偏好)以及 YouTube(观看内容)。
工作方式:
| 方面 | 细节 |
|---|---|
| 主要用例 | 个性化旅行规划 |
| 数据来源 | Gmail、Google Photos、Google Search、YouTube |
| 用户控制 | 选择已连接的应用,随时管理设置 |
| 可用性 | Gemini 应用(iOS/Android) |
用户可以选择连接哪些应用,并可随时修改个性化偏好。该功能属于通往 Google I/O 2026(5月19日)的路线图之一,届时预计会有更多关于 Gemini 智能体能力的重大公告。Personal Intelligence 延续了 Gemini Agent(随 Gemini 3 于 2025 年 11 月发布)的思路,让用户通过其现有的 Google 数据来获得个性化体验。
GitHub Copilot cloud agent — 组织级 secrets 和 variables
5月8日 — GitHub 为企业团队迈出了重要一步:Copilot cloud agent 现在拥有了专门的“Agents”分区来管理 secrets 和 variables,独立于“Actions”、“Codespaces”和“Dependabot”部分。最主要的新变化是组织级配置——这是 Copilot cloud agent 的首次支持。
实际变化:
| 之前 | 之后 |
|---|---|
| secrets 按仓库逐个配置 | 在组织级进行集中配置 |
| 每个仓库重复设置 | 一个组织级 secret 可供所有选中的仓库访问 |
| 管理分散 | 在仓库和组织设置中都有专门的 “Agents” 分区 |
这使得共享配置的大规模部署更为容易:私有包仓库、通用 MCP 服务器、共享 API token。精细控制仍然可用:针对每个 secret 或 variable,管理员都可以选择哪些仓库可以访问它。
🔗 GitHub Changelog — Copilot cloud agent 的 secrets 和 variables
开发者工具 — 更新
GitHub Mobile — 直接从应用创建仓库
5月11日 — GitHub Mobile 现在允许直接在 iOS 和 Android 上创建仓库。在 iOS 上,+ 按钮可从首页或个人资料中访问。在 Android 上,则可从首页或个人资料的 Repositories 部分进入。用户可以定义名称、可见性(public/privé)、描述,选择模板,并通过 README、.gitignore 或许可证进行初始化。
Manus Website Builder — “Make a copy” 功能
5月11日 — Manus Website Builder 引入了在独立会话中复制 WebDev 项目的功能。复制时会转移的内容包括:完整源代码、数据库架构、secrets 和 values,以及一份会话历史摘要。不会转移的内容包括:数据库中的数据、自定义域名设置、GitHub 连接以及完整聊天历史。
复制后的项目会以未发布状态启动。典型用例包括:无风险重构、作为模板复用、分离的支付流程测试、按市场生成变体。
🔗 Manus 博客 — WebDev Make a copy
Codex + OpenAI Developers MCP Server
5月11日 — Codex 集成了 OpenAI Developers MCP Server,可通过 OpenAI API 直接加速构建 AI 应用和代理。一段演示视频配合发布,展示了加速后的开发工作流。
NVIDIA OpenShell v0.0.37 — 开源计算框架
5月11日 — NVIDIA 发布 OpenShell v0.0.37,这是一个开源的分布式计算框架。此版本带来了可插拔的 compute 驱动,支持 Docker、Podman、Kubernetes 和 MicroVM——可在不同运行时环境中执行 AI 工作负载,而无需修改应用代码。
其他新内容包括:OIDC + RBAC 网关认证、包含 Kubernetes 用户命名空间的 Helm chart、以及用于简化安装的 Debian/RPM/Homebrew 包。破坏性变更:在升级到 v0.0.37 之前必须重新创建网关。
Grok 20+ 个新连接器
5月11日 — Grok 通过 20+ 个新连接器扩展了集成能力:文档、日历、电子邮件、代码以及其他数据来源。此次扩展接续了 5 月 8 日宣布的初始连接器(emails、slides、calendar、Notion)。其目标是让用户无需借助第三方工具,就能直接从 Grok 界面自动化更多任务。
🔗 @grok 推文
Claude’s Constitution — 有声书版本
5月11日 — Claude’s Constitution,也就是定义该模型价值观与行为的文档,现已提供有声书(audiobook)格式。该录音由两位主要作者朗读:Amanda Askell 和 Joe Carlsmith,他们都是 Anthropic 的研究员。
有声书包含该文档的完整朗读、关于写作过程的问答(Q&A)、指导该文档的理念,以及对随着模型能力提升,Constitution 未来可能如何演变的思考。该 Constitution 仍可在 anthropic.com/constitution 上以文本形式获取,并采用 Creative Commons CC0 1.0 许可。
简讯
-
Gemini — 数字化纸质笔记 — Google 发布了一份教程,介绍如何通过 Gemini 将手写笔记数字化,从而自动生成学习指南或备忘卡。只需拍下页面照片,上传到 Gemini,并请求一个结构化指南。🔗 Google 博客
-
ElevenLabs × Mahindra — Mahindra(覆盖 100+ 个国家)部署了由 ElevenLabs 驱动的语音代理,以便在新款 SUV 发布期间扩大其销售拓展计划规模。🔗 @ElevenLabs 推文
-
OpenAI Campus Network — OpenAI 为其 Campus Network 开放了面向大学学生社团的兴趣登记表,旨在进一步扩大其学术影响力。🔗 openai.com
这意味着什么
两种相反的企业策略。 OpenAI DeployCo 和 Claude Platform on AWS 代表了企业 AI 部署的两种不同愿景。OpenAI 直接派出人力团队到客户现场,重新设计关键工作流——这是一种由 AI 增强、资本密集且依赖关系的咨询模式。Anthropic 则押注云基础设施,让 AWS 开发者能够在其现有环境中原生访问完整的 Claude API。前者通过现场团队加速价值实现,后者则通过与既有工具集成加速落地。这两种方法可以在同一家企业客户中同时存在。
实时语音代理正在进入生产。 Grok Voice Think Fast 1.0 和 GPT-Realtime-2(5 月 7 日发布)表明,主要厂商正在把客户支持语音从试点推进到生产部署。Mahindra 上的 ElevenLabs 便是一个具体例子:AI 语音代理被部署到覆盖 100+ 个国家的真实汽车发布活动中。下一轮竞争将围绕感知延迟、升级到人工客服的能力,以及边界场景处理展开。
代理工具链正围绕 MCP 标准化。 本周既有 Anthropic 在 Claude Platform on AWS 中宣布原生 MCP connector,也有 OpenAI 在 Codex 中集成 MCP Server 以加速应用开发。GitHub Copilot cloud agent 还将 secrets 组织级集中管理,以便更容易配置大规模代理。MCP 正在逐步成为代理的互操作层——这三项同时发布的公告证实了这一趋势。
个人 AI 正在建立在现有数据之上。 Gemini Personal Intelligence 并没有发明一种新模型:它是把已有内容(Gmail、Photos、Search、YouTube)连接起来,以个性化旅行建议。这是一个清晰的战略方向——最有用的 AI 不一定是最“博学”的 AI,而是最了解特定用户的 AI。预计 Google I/O 2026(5 月 19 日)将进一步强化这一趋势。
來源
- AWS 上的 Claude Platform — 官方博客
- Tweet @claudeai — AWS 上的 Claude Platform
- OpenAI 部署公司 — 官方公告
- Tweet @OpenAI — DeployCo
- Tweet @xai — Grok Voice Think Fast 1.0
- Tweet @GeminiApp — 個人智能
- GitHub Changelog — Secrets 和 Copilot cloud agent 變量
- GitHub Changelog — 在移動端創建倉庫
- Manus 博客 — Make a copy WebDev
- Tweet @OpenAIDevs — Codex + MCP Server
- Tweet @NVIDIAAI — OpenShell v0.0.37
- Tweet @grok — 20+ 個新連接器
- Tweet @AnthropicAI — Claude 的《Constitution》有聲書
- Google 博客 — 數字化你的筆記
- Tweet @ElevenLabs — Mahindra 語音代理
- OpenAI 校園網絡 — 社團表單
- AWS — Claude Platform
- Anthropic — Constitution