搜索

Anthropic 的 RSP v3.0、GPT-5.3-Codex 向所有开发者开放、Meta 与 AMD 签署约 6 GW GPU

Anthropic 的 RSP v3.0、GPT-5.3-Codex 向所有开发者开放、Meta 与 AMD 签署约 6 GW GPU

Anthropic 彻底修订了其安全策略,发布 RSP v3.0,引入了公开的 Frontier Safety Roadmap(前沿安全路线图)和带有外部审阅的季度 Risk Reports(风险报告)。OpenAI 结束了 GPT-5.3-Codex 的限时访问期,该模型现在通过 Responses API 向所有开发者开放。Meta 与 AMD 签署了一项多年协议,计划投入约 6 GW 的 GPU 容量以支持其 AI 模型。Qwen 推出四款 MoE 模型,其中 Qwen3.5-35B-A3B 在表现上超过了其先前的 235B 巨型模型。Claude Code 引入了可从手机继续会话的 Remote Control 功能。


Anthropic : Responsible Scaling Policy v3.0

2 月 24 日 — Anthropic 发布了第三版 Responsible Scaling Policy(RSP),这是约束其模型相关灾难性风险的自愿框架。

最初的 RSP 发布于 2023 年 9 月。两年半以来,模型获得了新能力——网页浏览、执行代码、使用计算机、多步骤自治动作——每项新能力都带来了需要应对的新风险。

行之有效的做法

RSP 促使 Anthropic 开发了更强健的安全围栏,例如用于阻断与生物武器相关内容的分类器,以满足 ASL-3 要求。ASL-3 标准已于 2025 年 5 月启用并投入运行。OpenAI 和 Google DeepMind 在最初公告后的几个月内也采用了类似框架。RSP 还帮助为法律文本提供参考(如加州的 SB 53、欧盟 AI 法案)。

未达预期之处

能力阈值在实践中比预想更模糊——判断模型是否“确实”越过某个阈值仍然困难。政府的跟进速度没有达到预期,政治环境对监管也不友好。某些高 ASL 要求(ASL-4、ASL-5)可能无法单方面满足。

RSP v3.0 的三个关键变化

v3.0 现在区分了 Anthropic 在无须其他参与者配合时承诺将独自完成的行动,以及一个行业层面应采纳的“能力→缓解措施”映射表。

同时发布的第二份文件 —— Frontier Safety Roadmap —— 设定了公开的具体目标:开展“登月级”研发项目以保护模型权重,开发超越数百名人工参与者的自动化 red-teaming,建立所有关键开发活动的集中登记系统。

最后,Anthropic 承诺每 3 到 6 个月发布一次 Risk Reports:包括模型的安全概况、能力/威胁/缓解的阐述,对于最先进模型还将提供独立专家审阅并给予对未删节报告的访问权限。

“We’re updating our Responsible Scaling Policy to its third version. Since it came into effect in 2023, we’ve learned a lot about the RSP’s benefits and its shortcomings. This update improves the policy, reinforcing what worked and committing us to even greater transparency.”

🇨🇳 我们正在更新我们的 Responsible Scaling Policy,进入第三版。自 2023 年生效以来,我们对其的优点和局限学到了很多。这次更新通过加强已有成效并承诺更高的透明度来改进该政策。@AnthropicAI 在 X 上

🔗 RSP v3.0(Anthropic)


OpenAI : GPT-5.3-Codex en disponibilité générale

2 月 24 日 — GPT-5.3-Codex 现已通过 OpenAI 的 Responses API 向所有开发者开放。该模型在 2 月初以限量访问形式推出;现在进入普遍可用阶段。

GPT-5.3-Codex 将前沿的代码性能与专业知识能力合并于单一模型。根据早期整合方的反馈,其“在能力上显著更强,且在 token 效率上比 GPT-5.2 提高 3 至 4 倍”。平台 Lovable 是最早将其用于复杂用例的团队之一。

该模型也可通过 OpenRouter 获取,便于开发者在不直接调用 OpenAI API 的情况下将其整合到现有工作流中。

ÉlémentDétail
DisponibilitéResponses API (accès général)
Efficacité3-4x plus efficace en tokens vs GPT-5.2
Accès alternatifOpenRouter

🔗 Tweet @OpenAIDevs


Meta + AMD : accord multi-annuel pour ~6 GW de GPU

2 月 24 日 — Meta 宣布与 AMD 达成多年合作,将最新的 AMD Instinct GPU 集成进其全球基础设施。

部署计划约为 6 GW 的数据中心容量,目标是开发尖端 AI 模型,并将“个人超智能”带给全球数十亿用户。

“Today we’re announcing a multi-year agreement with @AMD to integrate their latest Instinct GPUs into our global infrastructure. With approximately 6GW of planned data center capacity dedicated to this deployment, we’re scaling our compute capacity to accelerate the development of cutting-edge AI models and deliver personal superintelligence to billions around the world.”

🇨🇳 今天,我们宣布与 @AMD 签署一项多年协议,将其最新的 Instinct GPU 纳入我们的全球基础设施,计划为该部署提供约 6 GW 的数据中心容量,以提升我们的计算能力,加速尖端 AI 模型的开发,并向全球数十亿人提供个人超级智能。@AIatMeta 在 X 上

该协议标志着 Meta 在 GPU 供应商方面的显著多元化,此前其主要依赖 NVIDIA。如此规模的合同——6 GW,对单一合作伙伴而言是一项可观的基础设施投入——展示了 Meta 在下一代模型计算力方面的雄心。

🔗 Tweet @AIatMeta


Qwen 3.5 Medium Series : 4 modèles MoE, “More intelligence, less compute”

2 月 24 日 — 阿里巴巴 Qwen 推出 Qwen 3.5 Medium 系列,包含四款 MoE(Mixture of Experts)架构的模型。

最显著的成果是 Qwen3.5-35B-A3B:仅有 3B 个活跃参数(总计 35B),其表现超过了先前家族中的巨型模型 Qwen3-235B-A22B。MoE 架构和大规模的 RL 训练使得这种高密度效率成为可能。

ModèleParamètres actifsNote
Qwen3.5-FlashContexte 1M tokens, outils intégrés, hébergé
Qwen3.5-35B-A3B3B actifs / 35B totalSurpasse Qwen3-235B-A22B
Qwen3.5-122B-A10B10B actifs / 122B total
Qwen3.5-27B27B

Qwen3.5-Flash 是该系列的托管版本,默认提供一百万 token 的上下文和集成工具。模型可在 HuggingFace、ModelScope 和 Qwen Chat 上获取。

🔗 Tweet @Alibaba_Qwen


Claude Code v2.1.51 : Remote Control depuis mobile

2 月 24 日 — Claude Code v2.1.51 引入了 remote-control,这是该版本最受期待的功能:可以从手机继续本地会话。

在终端上启动的 Claude Code 会话可以通过 /remote-control 在 Claude Code 移动应用上继续。该功能以 research preview 形式向 Max 用户开放。

除了 Remote Control,本次版本还带来了多项技术改进:

ChangementDétail
Plugin marketplace timeoutGit : 30s → 120s, configurable via CLAUDE_CODE_PLUGIN_GIT_TIMEOUT_MS
npm registriesSupport registres personnalisés et pinning de version pour plugins
BashToolSkip login shell par défaut quand snapshot disponible
Hooks sécuritéFix : statusLine et fileSuggestion hooks sans acceptation workspace trust
Réduction contexteTool results > 50K chars persistés sur disque (était 100K)

🔗 CHANGELOG Claude Code


Claude Cowork : marketplace privée de plugins et orchestration cross-apps

2 月 24 日 — Anthropic 对 Cowork 进行了重大更新,推出企业私有的 plugin marketplace、新连接器以及跨应用的编排功能。

管理员现在可以为其组织创建 私有的 plugin marketplace:可从模板或从零开始创建,并由 Claude 指导配置。一个新的统一菜单 “Customize” 集中管理 plugins、skills 和连接器(MCP)。管理员还可按用户进行配置、支持自动安装,以及从私有 GitHub 仓库来源获取 plugins(私密 beta)。

在连接器方面,名单扩展至 Google Workspace(Calendar、Drive、Gmail)、DocusignApolloClayOutreachSimilarwebMSCILegalZoomFactSetWordPressHarvey。Slack、LSEG、S&P Global 和 Tribe AI 等公司也发布了各自的 plugins。

新的 按部门划分的 plugin 模板 可用:

DépartementExemples de workflows
RHLettres d’offre, onboarding, évaluations performance
DesignCritiques UX, audits accessibilité, plans recherche utilisateur
EngineeringStandups, incident response, checklists deploy, postmortems
OpérationsDocumentation processus, évaluation fournisseurs
FinanceAnalyse de marché, modélisation financière, slides PowerPoint
Investment BankingDocuments de transaction, analyses comparables
Private EquityDue diligence, scoring par critères d’investissement

Claude 现在还可以 在 Excel 与 PowerPoint 之间编排任务——在 Excel 中分析数据,然后生成 PowerPoint 演示文稿,并在 add-in 之间传递上下文。该功能以 research preview 形式在 Mac 和 Windows 的所有付费计划中提供。

最后,支持 OpenTelemetry 使管理员能够跟踪团队的使用情况、成本与工具活动。

🔗 Cowork plugins 企业博客 🔗 Tweet @claudeai


OpenAI : Codex CLI v0.99.0

2 月 24 日 — Codex CLI 更新至 0.99.0,带来若干新功能。

命令 /statusline 现在允许定制 TUI 界面底部的元数据显示。支持以 GIF 和 WebP 格式附加图片。直接执行的 shell 命令不再阻塞当前交互轮次——它们可以并发执行。shell 环境与 rc 配置文件的快照功能也已启用。

FeatureDétail
/statuslineConfigurer le footer TUI interactivement
Images GIF/WebPNouveaux formats acceptés en pièces jointes
Shell snapshotSnapshot de l’environnement shell et rc files
App-server APIsTurn/steer, feature discovery, resume_agent
Web search controlModes restreints via requirements.toml (Enterprise)

同时包含了一个安全修复(RUSTSEC-2026-0009)。

npm install -g @openai/codex@0.99.0

🔗 Codex Changelog v0.99.0


DeepSeek-V3.2 : version officielle

2 月 24 日 — DeepSeek 宣布 DeepSeek-V3.2 的正式版本,它取代了 2025 年 11 月发布的实验版 V3.2-Exp。

根据 deepseek.com 首页横幅,V3.2 强化了 Agent 能力并引入了更深层次的思考/推理(thinking/reasoning)。该版本已在网页版、移动应用和 API 上可用。完整技术细节已发布在微信(DeepSeek 在中文中的主要公告渠道)。

🔗 deepseek.com


Perplexity et Comet : mode vocal pour tous

2 月 24 日 — Perplexity 在其服务 Perplexity 和浏览器 Comet 上大规模部署了语音模式更新,向所有用户开放——不仅限于订阅用户。

Comet 的新语音模式允许用户就屏幕上显示的内容向 AI 提问、以语音在网站之间导航,并在多个标签页间保持连贯对话而不丢失上下文。这种多标签页的上下文持久性相比传统语音助手是一次进步。

AspectDétail
DisponibilitéTous les utilisateurs (pas uniquement abonnés)
PlateformesAndroid, Mac, Windows
Fonctionnalité cléNavigation vocale multi-onglets avec contexte persistant

🔗 Tweet @perplexity_ai 🔗 Tweet @comet


Google DeepMind : Music AI Sandbox × Wyclef Jean

2 月 24 日 — Google DeepMind 与 YouTube 公布了与制作人兼艺术家 Wyclef Jean 合作的 Music AI Sandbox 项目。

Music AI Sandbox 由 Lyria 3(2 月 18 日公布的音乐生成模型)驱动,允许专业音乐人将 AI 作为创作伙伴进行实验。Wyclef Jean 使用这些工具开发了他的歌曲 “Back from Abu Dhabi”。创作过程在 YouTube 上有视频记录。

该合作是 Google DeepMind 启动的一系列与艺术家合作的项目之一,旨在在真实录音室环境中探索 AI 在音乐创作中的应用。

🔗 Tweet @GoogleAI 🔗 Tweet @GoogleDeepMind


Google DeepMind : Robotics Accelerator en Europe

2 月 24 日 — Google DeepMind 宣布在欧洲启动 Robotics Accelerator,这是一个面向机器人领域初创公司的加速项目。

其目标是在技术与商业化之间架起桥梁,加速下一代物理代理的发展。该项目被定位为面向初创公司的解决方案,可使用 Google DeepMind 的资源与专业知识。

🔗 Tweet @GoogleDeepMind


NVIDIA + Red Hat : AI Factory pour l’entreprise

2 月 24 日 — Red Hat 与 NVIDIA 联合推出 Red Hat AI Factory with NVIDIA,旨在加速企业采用 AI。

该平台将 Red Hat AI Enterprise(模型编排与部署)与 NVIDIA AI Enterprise(针对 NVIDIA GPU 优化的软件栈)结合,目标是降低运行复杂度并减少在生产环境中部署 AI 应用的总体拥有成本。

🔗 Tweet @NVIDIAAI


Black Forest Labs : Safety Evaluation — 10x moins de vulnérabilités

2 月 24 日 — Black Forest Labs 发布了对其 FLUX 模型进行的第三方独立风险评估结果。

结果显示,与其他流行的开放权重图像模型相比,其漏洞数量减少了超过 10 倍。 BFL affirme que haute performance, innovation ouverte et garde-fous peuvent aller de pair — une démarche de transparence rare dans l’industrie des modèles image open source.

🔗 推文 @bfl_ml


要点

Claude Code v2.1.52 — 在 v2.1.51 之后发布的定向补丁:修复了 Windows 上 VS Code 扩展的崩溃 (command 'claude-vscode.editor.openLast' not found)。没有新功能。

GitHub Copilot SDK — PowerPoint 代理 — GitHub 分享了一个演示(2 月 23 日),展示如何使用 Copilot SDK 构建一个代理,该代理能够检索最新文档、分析现有幻灯片以复现其样式,并直接在 PowerPoint 中生成新的幻灯片。 🔗 推文 @github

Runway — Interior Designer — Runway 展示了一个创意用例:通过 Nano Banana Pro、Kling 3.0 和 Gen-4.5 的组合,将房间照片转化为个性化的室内设计。这是一个展示 2 月 20 日推出的多模型平台的市场演示。 🔗 推文 @runwayml


这意味着

Anthropic 的 RSP v3.0 标志着 AI 安全方法的一个转折点:通过 Frontier Safety Roadmap 将其目标公开,并承诺进行带有外部审查的 Risk Reports,Anthropic 从内部政策转向了公共问责机制。这对整个行业构成了一种温和的施压——也是对关于部署决策不透明性的批评的一个含蓄回应。

Meta 与 AMD 签署的 6 GW 协议对 NVIDIA 发出了警报:此前 Meta 唯一使用的 GPU 供应商开始正面受到竞争。对 AMD 而言,这是对其 GPU Instinct 在大规模上的一次验证,尽管它们在训练工作负载中仍然难以与 H100/H200 抗衡。

Qwen 3.5 Medium 证实 MoE 架构不再是超大模型的专属:一个 35B-A3B 能超越 235B,这是令人瞩目的智力压缩,对于没有基础设施来运行巨型模型的组织而言更易获得。


来源

本文件使用 gpt-5-mini 模型由法语(fr)翻译为中文(zh)。有关翻译过程的更多信息,请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator