Claude 创建交互式可视化，OpenAI 推出 Video API Sora 2，Google Maps 在 Gemini 的推动下重塑

2026年3月12日的新闻由三项重要产品公告组成：Claude 在对话中直接生成交互式可视化，OpenAI 将面向开发者开放由 Sora 2 驱动的 Video API，Google Maps 借助 Gemini 推出十多年来最深度的重构。同时，Claude Code 发布了两个更新（v2.1.73 与 v2.1.74），Perplexity 将 Computer 向 Pro 订阅用户开放，ElevenLabs 在其创作平台中推出了 Flows 与 Music Finetunes。

Claude 在对话中生成交互式可视化

3月12日 — Claude 现在可以在对话中直接创建交互式图表、示意图和可视化，而无需编写代码。该功能作为测试版向所有订阅开放，包括免费计划。

该功能源自去年秋季发布的“Imagine with Claude”预览，改变了与助手的交互方式：可视化内容直接以内联形式出现在回复中，而不是放在单独的侧栏。它们是临时的——会随着对话演进而更新或消失——不同于 Artifacts，那些是用于共享或下载的永久性文档。

一些具体使用示例：询问复利如何运作会生成一条可交互的曲线以供操作，询问元素周期表会生成可点击查看每个元素详情的可视化。可以用类似 “draw this as a diagram” 或 “visualize how this might change over time” 的指令触发可视化。Claude 会在认为合适时主动生成可视化，用户也可显式请求。

此功能属于 Claude 最近一系列回答能力的改进：专门格式的食谱、可视化天气，以及与 Figma、Canva 和 Slack 的直接集成。

“Claude can now build interactive charts and diagrams, directly in the chat. Available today in beta on all plans, including free.”

🇨🇳 Claude 现在可以直接在对话中创建交互式图表和示意图。自今日起在所有订阅（包括免费版）以测试版形式可用。 — @claudeai 在 X 上

🔗 Claude 现在创建交互式图表、图示和可视化

Claude Code v2.1.74：上下文管理与多平台修复

3月12日 — Claude Code 2.1.74 版本改进了上下文管理，并修复了一系列在 Windows 和 macOS 上的问题。

新功能：

功能	描述
`/context` 改进	可操作的建议：识别上下文中的重型工具、内存膨胀与容量警告，并提供优化建议
`autoMemoryDirectory`	新参数用于配置用于自动记忆存储的自定义目录
`CLAUDE_CODE_SESSIONEND_HOOKS_TIMEOUT_MS`	新参数用于配置 hooks `SessionEnd` 的超时（此前固定为 1.5 秒）

主要修复包括：流式 (streaming) 模式下 API 响应缓冲区的内存泄漏导致 Node.js RSS 无上限增长；managed ask 策略无法被用户规则 allow 绕过的问题；代理 frontmatter model: 中完整模型 ID（例如 claude-opus-4-5）被静默忽略的问题现在已正确接受。MCP OAuth 修复涵盖了回调端口已被占用导致的阻塞以及在 refresh token 过期后缺乏重新认证的问题（影响如 Slack 的连接器）。在 macOS 上，原生二进制文件现在包含 entitlement audio-input，以便 macOS 在语音模式下正确显示麦克风授权请求。

🔗 Claude Code 更新日志

Claude Code v2.1.73：稳定性、Bedrock ARNs 与 OAuth SSL

3月11日 — 2.1.73 版本修复了若干重要稳定性问题，包括与 skills 相关的 CPU 卡死与死锁。

新功能：

功能	描述
`modelOverrides`	新参数用于将模型选择器的输入映射到自定义提供者模型 ID（例如：Bedrock inference profile ARNs）
Guidance OAuth SSL	当因 SSL 证书错误（企业代理、`NODE_EXTRA_CA_CERTS`）导致 OAuth 连接或连通性检查失败时，提供可操作的指导

主要修复：由复杂 bash 命令的权限提示触发的 CPU 卡死与 100% 循环；在大量 skill 文件同时更改时可能冻结 Claude Code 的阻塞（例如在包含大型文件夹 .claude/skills/ 的仓库中 git pull）；带有 model: opus / sonnet / haiku 的子代理在 Bedrock、Vertex 和 Microsoft Foundry 上被静默回退到旧版本的问题。

🔗 Claude Code 更新日志

Ramp AI Index：Anthropic 成为企业默认选择

3月11日 — 根据最新的 Ramp AI Index 报告，Anthropic 已成为企业首次购买时首选的 AI 提供商。Ramp Economics Lab 首席经济学家 Ara Kharazian 分享的图表显示，2026 年初 Anthropic 在新企业客户中的市场份额约为 70%，而 OpenAI 约为 25%——相比 2025 年出现了显著的反转。

数据来自使用 Ramp 平台（企业信用卡与支付）的超过 50,000 家企业，因此是衡量企业真实 AI 支出动向的可靠风向标。Anthropic 的增长主要由 Claude 在企业环境中的采用推动（API、Claude for Work、企业级集成）。

🔗 Ramp AI Index 在 X 上

OpenAI Video API：Sora 2 对开发者开放

3月12日 — OpenAI 向开发者发布 Video API，一套用于创建、扩展、修改与管理视频的编程接口。该能力由 OpenAI 的第二代视频生成模型 Sora 2 提供动力。

Video API 暴露了两个变体：sora-2，面向速度与探索（快速迭代、社交内容、原型），以及 sora-2-pro，面向制作质量（电影级输出、营销素材、最高支持 1920×1080 分辨率）。两种变体支持 16 到 20 秒的生成时长，且可扩展到最多 120 秒。

通过 POST /videos 端点可用的主要功能包括：基于文本 prompt 的生成、参考图片引导（约束首帧）、可在多次生成中复用的非人类角色一致性（POST /v1/videos/characters），以及通过 POST /v1/videos/edits 的定向编辑。处理为异步，支持通过 webhook 在渲染完成时接收通知。对于离线渲染队列，也提供 Batch API 的批量处理。

内容限制适用：不允许表现真实人物、不允许受版权保护的角色、不允许成人内容（该限制未来可能调整）。

🔗 Video API 文档

3月12日 — Google Maps 在 Gemini 的驱动下迎来十多年来最大的一次导航更新，同时推出两种新体验。

Ask Maps 是一种新的会话式体验，允许针对真实地点提出复杂问题。例如可以询问“我的手机快没电了——哪里可以充电且不需要排队买咖啡？”或“今晚有没有带灯的网球场可用？”该功能基于超过 3 亿地点数据和来自超过 5 亿贡献者的评论。回答会根据之前保存或搜索的地点进行个性化。Ask Maps 已开始在美国和印度的 Android 与 iOS 上推出，桌面端随后到来。

Immersive Navigation 改造了驾驶体验，提供反映周边建筑、桥梁与地形的 3D 视图。Gemini 分析 Street View 图像与航拍照片以展示关键细节：车道、斑马线、交通信号灯、停车标志。该功能还提供自然语音导航（如“通过此出口后再在下一出口驶入 Illinois 43 South”）、替代路线的权衡信息（收费路段 vs 交通）以及实时扰动提醒。Immersive Navigation 今日开始在符合条件的美国 iOS 与 Android 设备、CarPlay、Android Auto 以及集成了 Google 的车辆上部署。

🔗 Ask Maps 与 Immersive Navigation：Google Maps 的新 AI 功能

GitHub Copilot：JetBrains 中的自动模型选择进入 GA

3月12日 — GitHub 宣布在所有 JetBrains 开发环境（IntelliJ IDEA、PyCharm、WebStorm 等）中向所有 Copilot 订阅用户普遍开放（Generally Available）自动模型选择功能。

“Auto” 模式会根据任务选择最合适的模型，并考虑速率限制。开发者可完全可见：悬停在回答上可以看到使用了哪个模型，并随时切换到特定模型。计费基于实际选择的模型，目前乘数介于 0x 到 1x 之间。

GitHub 表示自动选择将逐步变得更智能，能够基于任务的具体上下文（代码生成、审查、聊天等）挑选模型。该功能此前已在 JetBrains 中预览，并已在 VS Code 中 GA 推出。

🔗 Copilot 在 JetBrains IDEs 中的自动模型选择已进入 GA

GitHub Copilot CLI：以 SQLite 记录会话历史

3月11日 — GitHub Copilot CLI 现在集成了本地 SQLite 数据库，用于记忆终端会话历史。实际上，如果几天前你通过命令行解决了一个问题，Copilot CLI 可以帮你回忆起解决方案——无需翻查 shell 历史或笔记。该功能属于 GitHub Copilot CLI 普及化第二阶段，通过 gh copilot 可访问。

🔗 GitHub Copilot CLI

Perplexity Computer 向 Pro 订阅开放

3月12日 — Perplexity Computer——能够在网页、文件与已连接工具上执行多步骤复杂工作流的代理——现已向 Pro 订阅用户开放。

此前仅对 Max 订阅与企业客户可用，Perplexity Computer 提供超过 20 个高级模型、预设与可定制的技能（skills），以及数百个连接器。Max 订阅用户仍在每月额度与更高消费上限方面保有优势。

🔗 Perplexity Computer

Perplexity Computer for Enterprise：四周节省 160 万美元

3月12日 — Perplexity 发布了一篇专门文章，详述 Perplexity Computer for Enterprise 的部署情况，该产品现已面向企业客户提供。

Computer for Enterprise 与企业已在使用的工具集成：Salesforce、Microsoft Teams、HubSpot、MySQL、GitHub，以及通过连接器支持的 400 多种其他服务。它会将每项任务路由到最合适的模型（约二十种内），并允许团队根据内部流程定义相应的技能（skills）。

团队	使用场景
财务	并购的尽职调查跟踪、文档分析与风险上报
法务	供应商协议审查、版本比较、合同批注（redlining）
市场	活动创建（创意、社媒帖文、登陸页）+ 性能仪表盘

Perplexity 分享了一项基于超 16,000 次请求的内部研究数据：Computer 在四周内节省了 160 万美元的人工成本，并完成了相当于 3.25 年工作的量。该解决方案通过了 SOC 2 Type II 认证，支持 SAML SSO，并为每项任务提供隔离执行。

🔗 Perplexity Computer 企业版

ElevenLabs Flows：统一图像、视频、音频的画布

3月11日 — ElevenLabs 推出 Flows，这是一款集成在 ElevenCreative 中的基于节点（node-based）的编辑器。在同一画布上，创作者可以串联并组合图像生成、视频、语音合成（Text to Speech）、嘴型同步（lip-sync）、音乐与音效。

这种方法类似于 ComfyUI 的工作流，但应用于 ElevenLabs 的多模态生态系统，工作室的所有音频与视频模型都可在同一处访问。

🔗 在 ElevenCreative 中推出 Flows

ElevenLabs Music Finetunes：生成音乐的风格一致性

3月12日 — ElevenLabs 在 ElevenCreative 中推出了 Music Finetunes。该功能允许创作者在保持风格一致性的前提下生成单独的人声、乐器或完整音乐曲目，基于 ElevenLabs 的音乐模型的微调版本（fine-tuned）。

🔗 在 ElevenCreative 中推出 Music Finetunes

BFL FLUX.2 [klein] 9B：图像编辑速度提升 2×

3月12日 — Black Forest Labs (BFL) 宣布其模型 FLUX.2 [klein] 9B 的一项显著更新：图像编辑现在速度提升 2×，特别是在使用多张参考图像时更为明显。

细节	数值
模型	FLUX.2 [klein] 9B
提升	编辑速度提升 2×
强化场景	多参考图像
价格	不变
权重	HuggingFace (`black-forest-labs/FLUX.2-klein-9b-kv`)

对现有 FLUX.2 [klein] 9B 用户的升级通过 API 自动且免费推送。 Les utilisateurs du modèle [klein] 4B peuvent accéder à la version 9B améliorée via un nouvel endpoint en préversion.

🔗 BFL 在 X 上的公告

Mistral AI Now Summit：巴黎，2026 年 5 月 28 日

3月12日 — Mistral AI 宣布其首个旗舰活动：“AI Now Summit”，这是一天专注于企业 AI 转型的活动，定于 2026 年 5 月 28 日在巴黎 举行。

主题	描述
企业开源	将开源作为端到端企业 AI 转型的基础
投产	从试点走向大规模部署
AI 基础设施	构建企业级基础设施
2026 年创新	机器人技术、视觉-语言模型 (VLMs)、多模态 AI

此次活动将汇聚来自全球的高管。目前报名尚未开放；可在 ainowsummit.com 加入候补名单。

🔗 AI Now Summit 在 X 上

这意味着什么

3月12日这一天反映了两股趋同趋势。一方面，通用型 AI 助手 —— Claude、Perplexity、Google Maps —— 正在增强功能以减少从提问到可用答案之间的摩擦：不再需要写代码就能看到图表，不再需要反复改写提示就能找到餐厅。另一方面，开发者获得了新的可编程组件：OpenAI 的 Video API 将视频生成带入自动化工作流，Claude Code 则继续为企业环境（Bedrock、SSL 代理、跨 Windows/macOS 的多平台）进行打磨。

Ramp AI Index 报告证实，这一趋势已体现在真实采购中：在新兴企业中约占 ~70% 市场份额的 Anthropic 不再仅仅是 OpenAI 的一个替代选项 —— 它已成为默认的入口。竞争如今更侧重于集成质量和生产可靠性，而非仅仅模型的算力。

来源

本文件已使用模型 gpt-5-mini 从法语（fr）翻译为中文（zh）。有关翻译过程的更多信息，请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator