2026年3月12日的新闻由三项重要产品公告组成:Claude 在对话中直接生成交互式可视化,OpenAI 将面向开发者开放由 Sora 2 驱动的 Video API,Google Maps 借助 Gemini 推出十多年来最深度的重构。同时,Claude Code 发布了两个更新(v2.1.73 与 v2.1.74),Perplexity 将 Computer 向 Pro 订阅用户开放,ElevenLabs 在其创作平台中推出了 Flows 与 Music Finetunes。
Claude 在对话中生成交互式可视化
3月12日 — Claude 现在可以在对话中直接创建交互式图表、示意图和可视化,而无需编写代码。该功能作为测试版向所有订阅开放,包括免费计划。
该功能源自去年秋季发布的“Imagine with Claude”预览,改变了与助手的交互方式:可视化内容直接以内联形式出现在回复中,而不是放在单独的侧栏。它们是临时的——会随着对话演进而更新或消失——不同于 Artifacts,那些是用于共享或下载的永久性文档。
一些具体使用示例:询问复利如何运作会生成一条可交互的曲线以供操作,询问元素周期表会生成可点击查看每个元素详情的可视化。可以用类似 “draw this as a diagram” 或 “visualize how this might change over time” 的指令触发可视化。Claude 会在认为合适时主动生成可视化,用户也可显式请求。
此功能属于 Claude 最近一系列回答能力的改进:专门格式的食谱、可视化天气,以及与 Figma、Canva 和 Slack 的直接集成。
“Claude can now build interactive charts and diagrams, directly in the chat. Available today in beta on all plans, including free.”
🇨🇳 Claude 现在可以直接在对话中创建交互式图表和示意图。自今日起在所有订阅(包括免费版)以测试版形式可用。 — @claudeai 在 X 上
Claude Code v2.1.74:上下文管理与多平台修复
3月12日 — Claude Code 2.1.74 版本改进了上下文管理,并修复了一系列在 Windows 和 macOS 上的问题。
新功能:
| 功能 | 描述 |
|---|---|
/context 改进 | 可操作的建议:识别上下文中的重型工具、内存膨胀与容量警告,并提供优化建议 |
autoMemoryDirectory | 新参数用于配置用于自动记忆存储的自定义目录 |
CLAUDE_CODE_SESSIONEND_HOOKS_TIMEOUT_MS | 新参数用于配置 hooks SessionEnd 的超时(此前固定为 1.5 秒) |
主要修复包括:流式 (streaming) 模式下 API 响应缓冲区的内存泄漏导致 Node.js RSS 无上限增长;managed ask 策略无法被用户规则 allow 绕过的问题;代理 frontmatter model: 中完整模型 ID(例如 claude-opus-4-5)被静默忽略的问题现在已正确接受。MCP OAuth 修复涵盖了回调端口已被占用导致的阻塞以及在 refresh token 过期后缺乏重新认证的问题(影响如 Slack 的连接器)。在 macOS 上,原生二进制文件现在包含 entitlement audio-input,以便 macOS 在语音模式下正确显示麦克风授权请求。
Claude Code v2.1.73:稳定性、Bedrock ARNs 与 OAuth SSL
3月11日 — 2.1.73 版本修复了若干重要稳定性问题,包括与 skills 相关的 CPU 卡死与死锁。
新功能:
| 功能 | 描述 |
|---|---|
modelOverrides | 新参数用于将模型选择器的输入映射到自定义提供者模型 ID(例如:Bedrock inference profile ARNs) |
| Guidance OAuth SSL | 当因 SSL 证书错误(企业代理、NODE_EXTRA_CA_CERTS)导致 OAuth 连接或连通性检查失败时,提供可操作的指导 |
主要修复:由复杂 bash 命令的权限提示触发的 CPU 卡死与 100% 循环;在大量 skill 文件同时更改时可能冻结 Claude Code 的阻塞(例如在包含大型文件夹 .claude/skills/ 的仓库中 git pull);带有 model: opus / sonnet / haiku 的子代理在 Bedrock、Vertex 和 Microsoft Foundry 上被静默回退到旧版本的问题。
Ramp AI Index:Anthropic 成为企业默认选择
3月11日 — 根据最新的 Ramp AI Index 报告,Anthropic 已成为企业首次购买时首选的 AI 提供商。Ramp Economics Lab 首席经济学家 Ara Kharazian 分享的图表显示,2026 年初 Anthropic 在新企业客户中的市场份额约为 70%,而 OpenAI 约为 25%——相比 2025 年出现了显著的反转。
数据来自使用 Ramp 平台(企业信用卡与支付)的超过 50,000 家企业,因此是衡量企业真实 AI 支出动向的可靠风向标。Anthropic 的增长主要由 Claude 在企业环境中的采用推动(API、Claude for Work、企业级集成)。
OpenAI Video API:Sora 2 对开发者开放
3月12日 — OpenAI 向开发者发布 Video API,一套用于创建、扩展、修改与管理视频的编程接口。该能力由 OpenAI 的第二代视频生成模型 Sora 2 提供动力。
Video API 暴露了两个变体:sora-2,面向速度与探索(快速迭代、社交内容、原型),以及 sora-2-pro,面向制作质量(电影级输出、营销素材、最高支持 1920×1080 分辨率)。两种变体支持 16 到 20 秒的生成时长,且可扩展到最多 120 秒。
通过 POST /videos 端点可用的主要功能包括:基于文本 prompt 的生成、参考图片引导(约束首帧)、可在多次生成中复用的非人类角色一致性(POST /v1/videos/characters),以及通过 POST /v1/videos/edits 的定向编辑。处理为异步,支持通过 webhook 在渲染完成时接收通知。对于离线渲染队列,也提供 Batch API 的批量处理。
内容限制适用:不允许表现真实人物、不允许受版权保护的角色、不允许成人内容(该限制未来可能调整)。
Google Maps:Ask Maps 与 Immersive Navigation
3月12日 — Google Maps 在 Gemini 的驱动下迎来十多年来最大的一次导航更新,同时推出两种新体验。
Ask Maps 是一种新的会话式体验,允许针对真实地点提出复杂问题。例如可以询问“我的手机快没电了——哪里可以充电且不需要排队买咖啡?”或“今晚有没有带灯的网球场可用?”该功能基于超过 3 亿地点数据和来自超过 5 亿贡献者的评论。回答会根据之前保存或搜索的地点进行个性化。Ask Maps 已开始在美国和印度的 Android 与 iOS 上推出,桌面端随后到来。
Immersive Navigation 改造了驾驶体验,提供反映周边建筑、桥梁与地形的 3D 视图。Gemini 分析 Street View 图像与航拍照片以展示关键细节:车道、斑马线、交通信号灯、停车标志。该功能还提供自然语音导航(如“通过此出口后再在下一出口驶入 Illinois 43 South”)、替代路线的权衡信息(收费路段 vs 交通)以及实时扰动提醒。Immersive Navigation 今日开始在符合条件的美国 iOS 与 Android 设备、CarPlay、Android Auto 以及集成了 Google 的车辆上部署。
🔗 Ask Maps 与 Immersive Navigation:Google Maps 的新 AI 功能
GitHub Copilot:JetBrains 中的自动模型选择进入 GA
3月12日 — GitHub 宣布在所有 JetBrains 开发环境(IntelliJ IDEA、PyCharm、WebStorm 等)中向所有 Copilot 订阅用户普遍开放(Generally Available)自动模型选择功能。
“Auto” 模式会根据任务选择最合适的模型,并考虑速率限制。开发者可完全可见:悬停在回答上可以看到使用了哪个模型,并随时切换到特定模型。计费基于实际选择的模型,目前乘数介于 0x 到 1x 之间。
GitHub 表示自动选择将逐步变得更智能,能够基于任务的具体上下文(代码生成、审查、聊天等)挑选模型。该功能此前已在 JetBrains 中预览,并已在 VS Code 中 GA 推出。
🔗 Copilot 在 JetBrains IDEs 中的自动模型选择已进入 GA
GitHub Copilot CLI:以 SQLite 记录会话历史
3月11日 — GitHub Copilot CLI 现在集成了本地 SQLite 数据库,用于记忆终端会话历史。实际上,如果几天前你通过命令行解决了一个问题,Copilot CLI 可以帮你回忆起解决方案——无需翻查 shell 历史或笔记。该功能属于 GitHub Copilot CLI 普及化第二阶段,通过 gh copilot 可访问。
Perplexity Computer 向 Pro 订阅开放
3月12日 — Perplexity Computer——能够在网页、文件与已连接工具上执行多步骤复杂工作流的代理——现已向 Pro 订阅用户开放。
此前仅对 Max 订阅与企业客户可用,Perplexity Computer 提供超过 20 个高级模型、预设与可定制的技能(skills),以及数百个连接器。Max 订阅用户仍在每月额度与更高消费上限方面保有优势。
Perplexity Computer for Enterprise:四周节省 160 万美元
3月12日 — Perplexity 发布了一篇专门文章,详述 Perplexity Computer for Enterprise 的部署情况,该产品现已面向企业客户提供。
Computer for Enterprise 与企业已在使用的工具集成:Salesforce、Microsoft Teams、HubSpot、MySQL、GitHub,以及通过连接器支持的 400 多种其他服务。它会将每项任务路由到最合适的模型(约二十种内),并允许团队根据内部流程定义相应的技能(skills)。
| 团队 | 使用场景 |
|---|---|
| 财务 | 并购的尽职调查跟踪、文档分析与风险上报 |
| 法务 | 供应商协议审查、版本比较、合同批注(redlining) |
| 市场 | 活动创建(创意、社媒帖文、登陸页)+ 性能仪表盘 |
Perplexity 分享了一项基于超 16,000 次请求的内部研究数据:Computer 在四周内节省了 160 万美元的人工成本,并完成了相当于 3.25 年工作的量。该解决方案通过了 SOC 2 Type II 认证,支持 SAML SSO,并为每项任务提供隔离执行。
ElevenLabs Flows:统一图像、视频、音频的画布
3月11日 — ElevenLabs 推出 Flows,这是一款集成在 ElevenCreative 中的基于节点(node-based)的编辑器。在同一画布上,创作者可以串联并组合图像生成、视频、语音合成(Text to Speech)、嘴型同步(lip-sync)、音乐与音效。
这种方法类似于 ComfyUI 的工作流,但应用于 ElevenLabs 的多模态生态系统,工作室的所有音频与视频模型都可在同一处访问。
ElevenLabs Music Finetunes:生成音乐的风格一致性
3月12日 — ElevenLabs 在 ElevenCreative 中推出了 Music Finetunes。该功能允许创作者在保持风格一致性的前提下生成单独的人声、乐器或完整音乐曲目,基于 ElevenLabs 的音乐模型的微调版本(fine-tuned)。
🔗 在 ElevenCreative 中推出 Music Finetunes
BFL FLUX.2 [klein] 9B:图像编辑速度提升 2×
3月12日 — Black Forest Labs (BFL) 宣布其模型 FLUX.2 [klein] 9B 的一项显著更新:图像编辑现在速度提升 2×,特别是在使用多张参考图像时更为明显。
| 细节 | 数值 |
|---|---|
| 模型 | FLUX.2 [klein] 9B |
| 提升 | 编辑速度提升 2× |
| 强化场景 | 多参考图像 |
| 价格 | 不变 |
| 权重 | HuggingFace (black-forest-labs/FLUX.2-klein-9b-kv) |
对现有 FLUX.2 [klein] 9B 用户的升级通过 API 自动且免费推送。 Les utilisateurs du modèle [klein] 4B peuvent accéder à la version 9B améliorée via un nouvel endpoint en préversion.
Mistral AI Now Summit:巴黎,2026 年 5 月 28 日
3月12日 — Mistral AI 宣布其首个旗舰活动:“AI Now Summit”,这是一天专注于企业 AI 转型的活动,定于 2026 年 5 月 28 日在巴黎 举行。
| 主题 | 描述 |
|---|---|
| 企业开源 | 将开源作为端到端企业 AI 转型的基础 |
| 投产 | 从试点走向大规模部署 |
| AI 基础设施 | 构建企业级基础设施 |
| 2026 年创新 | 机器人技术、视觉-语言模型 (VLMs)、多模态 AI |
此次活动将汇聚来自全球的高管。目前报名尚未开放;可在 ainowsummit.com 加入候补名单。
这意味着什么
3月12日这一天反映了两股趋同趋势。一方面,通用型 AI 助手 —— Claude、Perplexity、Google Maps —— 正在增强功能以减少从提问到可用答案之间的摩擦:不再需要写代码就能看到图表,不再需要反复改写提示就能找到餐厅。另一方面,开发者获得了新的可编程组件:OpenAI 的 Video API 将视频生成带入自动化工作流,Claude Code 则继续为企业环境(Bedrock、SSL 代理、跨 Windows/macOS 的多平台)进行打磨。
Ramp AI Index 报告证实,这一趋势已体现在真实采购中:在新兴企业中约占 ~70% 市场份额的 Anthropic 不再仅仅是 OpenAI 的一个替代选项 —— 它已成为默认的入口。竞争如今更侧重于集成质量和生产可靠性,而非仅仅模型的算力。
来源
- Claude now creates interactive charts, diagrams and visualizations
- @claudeai 在 X 上
- Claude Code 更新日志
- Ramp AI Index — @arakharazian 在 X 上
- OpenAI Video API 文档
- @OpenAIDevs 在 X 上
- Ask Maps 与沉浸式导航 — Google Maps 博客
- Copilot 自动模型选择在 JetBrains IDEs 中普遍可用
- @github 在 X 上 — Copilot CLI SQLite
- @perplexity_ai 在 X 上 — Computer pour Pro
- Perplexity Computer for Enterprise
- 在 ElevenCreative 中引入 Flows
- 在 ElevenCreative 中引入 Music Finetunes
- @bfl_ml 在 X 上 — FLUX.2 klein 9B
- AI Now Summit Mistral — @MistralAI 在 X 上
本文件已使用模型 gpt-5-mini 从法语(fr)翻译为中文(zh)。有关翻译过程的更多信息,请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator