搜索

Anthropic 筹集 300 亿美元,Cerebras 上的 GPT-5.3-Codex-Spark,Gemini 3 Deep Think

Anthropic 筹集 300 亿美元,Cerebras 上的 GPT-5.3-Codex-Spark,Gemini 3 Deep Think

AI 领域非凡的一天:Anthropic 宣布筹集 300 亿美元资金,使其估值达到 3800 亿美元,OpenAI 在 Cerebras 上部署了 1000+ token/秒的实时 coding 模型,Google 将 Gemini 3 Deep Think 推向了科学领域的新纪录。在生态系统方面,xAI 围绕 4 个产品重组团队,Mistral 在瑞典投资 12 亿欧元,GitHub 因可靠性原因暂停了 GPT-5.3-Codex。


Anthropic 完成 300 亿美元 G 轮融资

2 月 12 日 — Anthropic 宣布完成 300 亿美元的 G 轮融资,使公司的投后估值达到 3800 亿美元。该轮融资由 GIC 和 Coatue 联合领投,D. E. Shaw Ventures、Dragoneer、Founders Fund、ICONIQ 和 MGX 参投。其他投资者名单包括红杉资本 (Sequoia Capital)、贝莱德 (BlackRock)、高盛 (Goldman Sachs)、富达 (Fidelity)、微软 (Microsoft) 和 NVIDIA 等。

指标数值
筹集金额300 亿美元
投后估值3800 亿美元
年化收入 (run-rate)140 亿美元
年增长率每年 10 倍(过去 3 年)
客户 >10 万美元/年一年增长 7 倍
Enterprise 客户 >100 万美元/年超过 500 家(2 年前为 12 家)
Fortune 10 客户10 家中有 8 家
Claude Code Run-rate25 亿美元(自 2026 年 1 月以来翻倍)
Claude Code 每周用户自 2026 年 1 月 1 日以来 2 倍
通过 Claude Code 的 GitHub Commits4%(1 个月内翻倍)
Claude Code 商业订阅自 2026 年初以来 4 倍
Claude Code 企业份额Claude Code 收入的 >50%

资金将用于基础研究、产品开发和基础设施扩展。Claude 仍然是唯一可在三大主要云平台使用的 frontier 模型:AWS (Bedrock)、Google Cloud (Vertex AI) 和 Microsoft Azure (Foundry)。Anthropic 在各种 AI 硬件(AWS Trainium、Google TPU、NVIDIA GPU)上训练和运行 Claude。

This fundraising reflects the incredible demand we are seeing from these customers, and we will use this investment to continue building the enterprise-grade products and models they have come to depend on.

🇨🇳 这笔融资反映了我们从这些客户那里看到的惊人需求,我们将利用这笔投资继续打造他们所依赖的企业级产品和模型。 — Krishna Rao, CFO d’Anthropic (@AnthropicAI sur X)

🔗 官方公告


GPT-5.3-Codex-Spark:Cerebras 上的实时模型

2 月 12 日 — OpenAI 在 research preview 中推出了 GPT-5.3-Codex-Spark,这是一款针对 Cerebras Wafer-Scale Engine 3 上的超快速推理进行优化的实时 coding 模型。这是首个部署在非 NVIDIA 硬件上的 OpenAI 模型。

Codex-Spark 是 GPT-5.3-Codex 的紧凑版本,专为延迟与智能同等重要的交互式工作而设计:有针对性的编辑、逻辑重构、具有即时反馈的界面调整。

规格详情
Token/秒> 1,000(标准模型为 50-100)
上下文窗口128k token
格式仅文本(多模态计划稍后推出)
客户端/服务器 overhead 减少80%(持久 WebSocket)
每 token overhead 减少30%
time-to-first-token 减少50%

该模型在 Cerebras Wafer-Scale Engine 3 上运行,这是一个单片处理器,可保持计算紧密耦合以实现高吞吐量推理。此次发布标志着 2026 年 1 月宣布的 OpenAI-Cerebras 合作伙伴关系的第一步。

Codex-Spark 可在 ChatGPT Pro 订阅者的 research preview 中、最新版本的 Codex 应用程序、CLI 和 VS Code 扩展中使用。API 访问仅限于选定的合作伙伴,计划进行更广泛的部署。

在 SWE-Bench Pro 和 Terminal-Bench 2.0 上,该模型通过在 GPT-5.3-Codex 的一小部分时间内完成任务,表现出稳健的性能。Research preview 阶段适用单独的速率限制。

最终,Codex 将提供两种互补模式:长视野推理(数小时/数天的自主任务)和实时协作(快速迭代)。这两种模式可以结合使用,将长任务委托给后台的子代理。

🔗 官方公告


Gemini 3 Deep Think:科学领域的纪录分数

2 月 12 日 — Google 宣布对其专业推理模式 Gemini 3 Deep Think 进行重大更新。该模型现在旨在解决科学、研究和工程中的具体挑战,而不仅仅是抽象理论。

Deep Think 是与科学家和研究人员密切合作更新的。目标是解决复杂的研究问题,在这些问题中,数据通常是混乱或不完整的,并且不存在单一的解决方案。该模型结合了深厚的科学知识和工程实用性。

纪录基准 (Benchmarks)

基准分数备注
Humanity’s Last Exam48.4%(无工具)frontier 模型的新标准
ARC-AGI-284.6%经 ARC Prize Foundation 验证
CodeforcesElo 3455竞技编程
IMO 2025金牌国际数学奥林匹克
IPhO 2025 (笔试)金牌国际物理奥林匹克
IChO 2025 (笔试)金牌国际化学奥林匹克
CMT-Benchmark50.5%高级理论物理

真实用例

  • 数学 (Lisa Carbone, Rutgers University):Deep Think 在一篇技术性很强的数学论文中发现了一个微妙的逻辑缺陷,该缺陷通过了人类同行评审。她致力于高能物理所需的数学结构。
  • 材料科学 (Wang Lab, Duke University):优化用于生长复杂晶体(半导体材料候选者)的制造方法。Deep Think 设计了一种生长超过 100 微米薄膜的配方。
  • 机械工程 (Anupam Pathak, Google Platforms & Devices):以软件的速度迭代物理原型。将草图转换为可 3D 打印对象(生成 STL 文件)的可能性。

Gemini 3 Deep Think 从今天开始向 Gemini 应用程序中的 Google AI Ultra 订阅者提供,并首次通过 API 向研究人员、工程师和企业提供早期访问。

🔗 官方公告


xAI 重组:4 个团队和 Macrohard

2 月 11 日 — xAI 在 X 上发布了 45 分钟的全员会议 (all-hands),揭示了在一半联合创始人(12 人中的 6 人)离职后公司的重大重组。最新离职的是 Tony Wu 和 Jimmy Ba。

Elon Musk 宣布将 xAI 重组为 4 个主要团队:

团队重点领导者
GrokChatbot + 语音-
Coding应用程序代码系统-
Imagine视频生成-
Macrohard计算机模拟 -> 商业Toby Pohlen

Macrohard 是最雄心勃勃的项目:根据 Toby Pohlen 的说法,该系统“能够做计算机在计算机上能做的所有事情”。这一雄心延伸到了 AI 设计火箭发动机。

公布的关键指标

  • X 的年度经常性收入(订阅)已超过 10 亿美元
  • Imagine 每天生成 5000 万个视频
  • 过去 30 天内超过 60 亿张图像

Musk 的星际愿景从轨道数据中心延伸到月球基地。这些公告是在 SpaceX 收购 xAI(2 月 2 日)以及过去一年中 12 位联合创始人中有 6 位(Kyle Kosic 去往 OpenAI,Christian Szegedy、Igor Babuschkin、Greg Yang、Tony Wu、Jimmy Ba)离职之后发布的。

🔗 TechCrunch 文章


Mistral 在瑞典投资 12 亿欧元

2 月 11 日 — Mistral AI 宣布与 EcoDataCenter 合作,投资 12 亿欧元(14 亿美元)在瑞典建设 AI 基础设施。这是 Mistral 在法国以外的首次 AI 基础设施投资。

数据中心将位于 EcoDataCenter 场地的 Borlänge(瑞典),计划于 2027 年开业。该设施将提供 23 兆瓦的计算能力,并托管最新一代 NVIDIA Vera Rubin GPU。

详情数值
金额12 亿欧元 / 14 亿美元
合作伙伴EcoDataCenter
地点Borlänge,瑞典
开业2027
容量23 MW
GPUNVIDIA Vera Rubin
预计收入5 年内 20 亿欧元

Mistral AI CEO Arthur Mensch 表示,这项投资是“朝着在欧洲建立致力于 AI 的独立能力迈出的具体一步”。选择瑞典是因为它可以获得清洁且相对便宜的能源。目标是交付一个完全欧洲的 AI stack——在整个 AI 价值链中设计、构建和运营,并在欧洲本地处理和存储数据。

🔗 Tech.eu 文章


Qwen-Image-2.0:统一的图像生成和编辑

2 月 10 日 — Alibaba 推出了 Qwen-Image-2.0,这是下一代图像生成基础模型,将 text-to-image 生成和图像编辑统一在一个架构中。

与 v1 相比的主要变化:

  • 统一的生成 + 编辑架构(以前是单独的模型)
  • 更紧凑的模型:7B 参数(v1 为 20B)
  • 改进的文本渲染,支持高达 1K token 的 prompts
  • 原生 2K 分辨率 (2048x2048)
基准Qwen-Image-2.0FLUX.1
DPG-Bench88.3283.84
AI Arena (盲测)#1-

该模型擅长以各种格式渲染中文和英文文本:信息图表、海报、书法、标牌。Qwen-Image-2.0 可在 Alibaba Cloud BaiLian 平台上进行 API 测试,并通过 Qwen Chat (chat.qwen.ai) 免费使用。

🔗 官方公告


Deep Research 迁移到 GPT-5.2

2 月 10 日 — OpenAI 将 ChatGPT Deep Research 更新为 GPT-5.2 模型,取代了以前的 o3 和 o4-mini 版本。此次更新带来了应用程序连接、特定站点搜索和实时控制。

功能详情
模型GPT-5.2(取代 o3 / o4-mini)
应用程序连接Gmail, Google Calendar, Google Contacts + 任何 MCP
目标搜索限制为特定站点和受信任来源
实时控制进度跟踪、中断和运行中重定向
研究计划启动前可创建和编辑
界面重新设计的侧边栏 + 全屏报告视图
导出PDF 和 DOCX

用户现在可以将 Deep Research 连接到任何 MCP 服务器或应用程序,并将网络搜索限制为受信任的站点,以获得更准确和可信的报告。应用程序作为受信任来源以只读模式工作。

部署于 2 月 10 日开始面向 Plus 和 Pro 用户,Free 和 Go 用户将在接下来几天内跟进。

🔗 官方公告


ChatGPT 加入五角大楼的 GenAI.mil

2 月 10 日 — OpenAI 宣布在美国国防部企业 AI 平台 GenAI.mil 上部署 ChatGPT 定制版本。ChatGPT 加入了该平台上的 Google Gemini(2025 年 12 月推出)和 xAI Grok(2025 年 12 月底添加)。

详情数值
平台GenAI.mil (DoD)
潜在用户~300 万(军事、文职、承包商)
活跃平台用户自推出以来 110 万独立用户
分类仅限非机密数据
基础设施授权的政府云
数据隔离数据隔离,不用于训练 OpenAI 模型

用例包括政策文件的综合和分析、起草采购材料、生成内部报告和合规清单,以及研究和规划协助。

🔗 官方公告


ElevenLabs for Government

2 月 11 日 — ElevenLabs 推出了 ElevenLabs for Government,这是在伦敦 ElevenLabs 峰会上宣布的一项致力于公共部门的计划。该平台提供专为政府组织设计的 AI 语音和聊天代理,可通过电话、聊天、电子邮件和 WhatsApp 全天候以多种语言提供服务。

该平台旨在实现三个目标:

  • 可访问性和包容性:能够即时解决公民请求的全渠道多语言代理
  • 效率和生产力:大批量联系的自动化和减少服务之间的转移
  • 信任和参与:改善对符合公共政策的通信的访问
部署详情
捷克共和国国家就业和福利热线,~5,000 次通话/天,85% 自主解决
乌克兰高级官员的数字孪生 + 公共服务,与数字化转型部合作
米德兰,德克萨斯州 (美国)语音公民礼宾 “Jacky”,估计每月减少 7,000 个未接来电

该平台通过了 SOC 2 Type 2、GDPR、CPRA 和 HIPAA 认证,以满足公共部门的安全要求。

🔗 官方公告


Anthropic 承担电价上涨

2 月 11 日 — Anthropic 宣布将承担因其数据中心导致的消费者电价上涨。公司做出了四项具体承诺:

承诺详情
电网基础设施成本承担 100% 的电网连接成本
新能源生产投产适应需求的新生产能力
减少电网压力投资于减少高峰消费的系统
社区投资创造数百个永久性工作岗位和数千个建筑工作岗位

🔗 官方公告


Anthropic 捐赠 2000 万美元用于 AI 监管

2 月 12 日 — Anthropic 宣布向一个新的两党美国 501(c)(4) 组织 Public First Action 捐赠 2000 万美元。目标是动员公民和政策制定者关注为了公共利益的 AI 问题。

Anthropic 的推文强调,AI 的采用速度比历史上任何技术都快,公共政策成功的窗口正在关闭。

🔗 X 上的公告


Claude Code Desktop:本地 plugins 和 Marketplace

2 月 11 日 — Boris Cherny (Anthropic 的 Claude Code 负责人) 发布了一个 thread,详细介绍了工程师喜欢 Claude Code 的原因:它的可定制性。他列出了 hooks、plugins、LSPs、MCPs、skills、effort、custom agents、status lines、output styles 作为定制机制。

与此同时,Lydia Hallie 宣布桌面上的 Claude Code 现在支持本地 plugins。用户可以从市场安装自定义 slash 命令、skills 和 MCP 服务器,并在桌面和 CLI 之间自动同步。

🔗 Boris Cherny thread


GitHub Mobile:Copilot 的模型选择器

2 月 11 日 — GitHub 在 iOS 和 Android 上的 GitHub Mobile 应用程序中的 Copilot Coding Agent 中添加了一个模型选择器。

Copilot Pro 和 Pro+ 用户现在可以直接从手机选择为其 coding agent 会话提供支持的 AI 模型,而无需通过桌面。

可用模型发布者
自动(默认 — 优化速度和性能)GitHub
Claude Opus 4.5Anthropic
Claude Opus 4.6Anthropic
Claude Sonnet 4.5Anthropic
GPT-5.1-Codex-MaxOpenAI
GPT-5.2-CodexOpenAI

自动模式会根据可用性自动选择模型以优化速度和性能。该功能现已向 Copilot Pro 和 Pro+ 订阅者提供。Business 和 Enterprise 支持即将推出。注意:2 月 9 日 GA 的 GPT-5.3-Codex 尚未出现在移动列表中。

🔗 GitHub 更新日志


GitHub 暂停 GPT-5.3-Codex(可靠性)

2 月 10 日 — GitHub 宣布暂时暂停在 GitHub Copilot 中部署 GPT-5.3-Codex,原因是为了平台可靠性,而这距离宣布其普遍可用仅一天。

这条推文在回复中引用了 2 月 9 日关于 GPT-5.3-Codex GA 的公告,产生了 357,500 次观看和 1,000 次点赞,证明了对开发者社区的影响。几位用户在回复中报告了服务可用性问题。

该模型尚未出现在移动模型选择器列表(2 月 11 日宣布)中这一事实可能与此暂停有关。

🔗 X 上的公告


Manus 推出 Project Skills

2 月 12 日 — Manus(现隶属于 Meta)推出了 Project Skills,这是一项允许为每个项目创建专用技能库的功能。

每个项目都可以汇集一组从“Team Skills”池或个人收藏中选择的 skills。想法:将标准项目文件夹转变为智能和自主的工作区。

功能描述
每个项目的库从团队或个人池中组装自定义 toolkits
包含的工作流只有显式添加到项目的 skills 才能被触发
锁定的工作流管理员可以锁定 skills 集以标准化流程

强调的好处:更快的入职,将个人专业知识扩展到组织,以及随着时间的推移而改进的“机构知识”构建。所有 Manus 用户均可立即使用。

🔗 官方公告


Gemini CLI v0.28.0 + 扩展设置

2 月 10-11 日 — Google 发布了 Gemini CLI 版本 0.28.0,并宣布了 Extension Settings,这是一项简化扩展配置的新功能。

Gemini CLI v0.28.0 (2 月 10 日)

新增详情
/prompt-suggest 命令用于 prompts 建议的新 slash 命令
自动主题根据终端背景进行适应
IDE 兼容性添加了对 Positron IDE 的支持
改进的 OAuth交互式和非交互式 OAuth 同意
检查清单组件用于 plan 模式下结构化任务管理的组件
子代理子代理 policies 的动态注册
后台执行后台 shell 命令

扩展设置 (2 月 11 日)

Gemini CLI 扩展现在可以定义用户在安装时提供的配置参数。通过交互式 prompts 自动设置,集成安全性(敏感数据如 API 密钥存储在系统钥匙串中),并通过 gemini extensions config 进行集中管理。Data Cloud 扩展 (BigQuery, Cloud SQL, Firestore, Looker, Spanner) 已经实现了此功能。

🔗 官方公告


Google Search 和 Gemini 中的 AI 购物

2 月 11 日 — Google 宣布将购物功能直接集成到其 AI 产品中——Search AI Mode 和 Gemini 聊天机器人。

用户现在可以直接在 Gemini 聊天机器人中购买 Etsy 和 Wayfair 商品。Direct Offers 是 AI Mode 中的一项新功能,允许品牌向潜在买家提供折扣。正在 Search 的 AI Mode 中测试针对零售商的新广告格式。

Google 正在与 Walmart、Target 和 Shopify 合作开发结账协议,允许消费者直接在 Google 的 AI 产品中完成购买。

🔗 PYMNTS 文章


GTIG 报告:针对 Gemini 的蒸馏攻击

2 月 12 日 — Google Threat Intelligence Group (GTIG) 发布了一份报告,显示 Gemini 已成为蒸馏攻击 (distillation attacks) 的目标——通过重复 prompts 进行的大规模克隆尝试。

一次活动在被发现之前向 Gemini 提交了超过 100,000 个 prompts。攻击专门针对 Gemini 的推理算法。攻击者主要是寻求竞争优势的私营公司和研究人员。

Google 的系统实时检测到了活动并调整了保护措施。Google 将蒸馏视为知识产权盗窃。

🔗 NBC News 文章


Codex CLI v0.99.0:并发 shell 执行

2 月 11 日 — OpenAI 发布了 Codex CLI v0.99.0,具有并发 shell 执行、可配置 statusline 和专用应用服务器 APIs。

功能详情
并发 shell 执行直接 shell 命令不再阻止正在进行的轮次
/statuslineTUI 页脚中元数据的交互式配置
自适应恢复选择器用于恢复会话的新选择器
应用服务器 APIs用于应用程序集成的专用 APIs
管理员控制用于网络搜索和网络的 admin 控制
图像GIF/WebP 支持
快照环境 Snapshotting
引导模式 (Steer mode)稳定且默认激活(Enter 发送,Tab 排队)

npm 打包已重做:特定于平台的二进制文件通过 @openai/codex dist-tags 分发,从而减小了包的大小。

🔗 Codex CLI 更新日志


Qwen Chat AI 幻灯片

2 月 12 日 — Qwen 宣布 AI Slides 即将登陆 Qwen Chat。该功能允许将不同类型的文档转换为演示文稿:项目文档 -> 会议幻灯片,论文 -> 口头讲演稿,产品信息 -> 销售讲演稿,主题 -> 教学讲演稿。

该功能是使用 Qwen Agent + Qwen-Image 2.0(几天前推出的图像模型)构建的。Chen Cheng 演示了通过集成搜索代理在几分钟内将学术文章转换为口头演示文稿的能力。

🔗 X 上的公告


这意味着什么

Anthropic 以 3800 亿美元的估值筹集 300 亿美元资金,证实了 frontier 模型在 AI 经济中的主导地位。140 亿美元的年化 run-rate 和 Claude Code 产生的 25 亿美元份额表明,AI 辅助 coding 已成为开发人员和企业的关键基础设施。

GPT-5.3-Codex-Spark 在 Cerebras 上的到来标志着 AI 硬件在 NVIDIA 之外实现多元化的转折点。1000+ token/秒的推理改变了与代码模型交互的性质,使流畅的实时协作成为可能。

Gemini 3 Deep Think 凭借其科学奥林匹克金牌和 ARC-AGI-2 上 84.6% 的分数表明,frontier 模型开始在专业领域达到与最优秀人类相当的科学推理水平。

xAI 通过 Macrohard 重组为 4 个团队——旨在做“计算机能做的所有事情”——以及 Mistral 在欧洲的巨额投资表明,AI 基础设施竞赛正在全球范围内加速。然而,GitHub 暂停 GPT-5.3-Codex 提醒我们,可靠性仍然是大规模部署的主要挑战。


来源