本周回顾
2025年的最后一周带来了一系列新功能:Anthropic为假期提供双倍用量,Qwen推出了具有声音克隆功能的完整TTS套件,Mistral为Vibe CLI添加了Skills,OpenAI详细介绍了其代理的安全策略,Gemini改进了其照片编辑能力。
Anthropic:假期2倍用量
2025年12月24日-27日 — Anthropic暂时为Pro和Max订阅者提供双倍的用量限制。
Starting at midnight PT tonight, all Pro and Max plans have 2x their usual usage limits through New Year’s.
🇨🇳 从今晚太平洋时间午夜开始,所有Pro和Max计划在新年期间都享有平常2倍的用量限制。 — @ClaudeAI on X
详情
| 计划 | 正常用量 | 假期促销 |
|---|---|---|
| Pro | 标准 | 2倍 |
| Max | 5倍 | 10倍 |
Max 5倍修复
12月27日,Anthropic发现并修复了一个影响Max 5倍用户的问题,并重置了受影响的计数器。
We’ve identified and fixed an issue with our usage promotion for Max 5x users. We’ve reset the affected counters.
🇨🇳 我们已发现并修复了Max 5倍用户用量促销的问题。我们已重置了受影响的计数器。 — @ClaudeAI on X
Qwen3-TTS:VoiceDesign和VoiceClone
2025年12月23日 — 阿里巴巴发布了其新的文本转语音套件,包含两个互补的模型。
Meet the new Qwen3-TTS lineup: VoiceDesign & VoiceClone! Create, control, and clone voices—faster and more expressive than ever.
🇨🇳 认识新的Qwen3-TTS阵容:VoiceDesign和VoiceClone!创建、控制和克隆声音——比以往更快、更具表现力。 — @Alibaba_Qwen on X
VoiceDesign
允许从文本描述创建自定义声音:
| 模型 | 延迟 | 用例 |
|---|---|---|
| VD-Flash | 超快 | 流媒体,实时 |
| VD-Turbo | 平衡 | 一般制作 |
VoiceClone
从几秒钟的音频样本中克隆声音:
- 对原始音色的高保真度
- 保留表现力(语调、情感)
- 支持多种语言
访问
- 交互式演示: Qwen Chat
- 官方博客: Qwen3-TTS VoiceDesign
- VoiceDesign: HuggingFace / ModelScope
- VoiceClone: HuggingFace / ModelScope
- API: VoiceDesign / VoiceClone
Qwen-Image-Edit-2511:改进的图像编辑
2025年12月23日 — Qwen图像编辑模型的重大更新。
Introducing Qwen-Image-Edit-2511 — a major upgrade over 2509, delivering significantly stronger consistency and more powerful real-world image editing.
🇨🇳 介绍Qwen-Image-Edit-2511 — 2509的重大升级,提供显著增强的一致性和更强大的现实世界图像编辑。 — @Alibaba_Qwen on X
改进
| 方面 | 2509 → 2511 |
|---|---|
| 一致性 | 更好地保留身份 |
| 真实编辑 | 在真实照片上更精确 |
| 质量 | 减少伪影 |
LightX2V优化
LightX2V框架带来了Day-0支持:
- 47% 框架加速
- CFG + 4步蒸馏:计算量减少25倍
- 生产部署的理想选择
可用性
- 交互式演示: Qwen Chat Image Edit
- 模型: HuggingFace / ModelScope
- 演示: HuggingFace Spaces
Mistral:Vibe CLI的Skills
2025年12月24日 — Mistral通过可重用的Skills系统扩展了其开发者CLI。
We’ve shipped Skills for Vibe CLI: your dev expertise and rules, bundled and reusable across projects.
🇨🇳 我们要发布Vibe CLI的Skills:您的开发专业知识和规则,打包并在项目中可重用。 — @MistralAI on X
概念
Skills允许打包:
- 特定于项目或团队的编码规则
- 模式和最佳实践
- AI的自定义指令
优势
| 益处 | 描述 |
|---|---|
| 可重用性 | 一个skill适用于所有项目 |
| 一致性 | 处处应用相同的标准 |
| 共享 | 开发人员之间可共享skills |
背景
此功能紧随Vibe CLI的改进:
- 12月:Context 200k tokens,Devstral 2
- 现在:用于自定义体验的Skills
OpenAI:ChatGPT Atlas安全
2025年12月22日 — OpenAI发布了一篇文章,详细介绍了其针对代理的提示注入保护策略。
We just published a post on how we continuously harden ChatGPT Atlas (and other agents) against prompt injection attacks.
🇨🇳 我们刚刚发布了一篇关于我们如何持续加固ChatGPT Atlas(及其他代理)以抵御提示注入攻击的文章。 — OpenAI Blog
提示注入:代理挑战
浏览网页或执行操作的AI代理容易受到隐藏在访问页面中的恶意内容的攻击。
OpenAI策略
| 层级 | 保护 |
|---|---|
| 检测 | 识别注入尝试 |
| 隔离 | 分离系统指令和内容 |
| 监控 | 持续监控异常行为 |
为什么重要
随着自主代理(ChatGPT Atlas、Claude Computer Use等)的兴起,安全变得至关重要。这种透明度有助于生态系统共同进步。
Gemini:高级照片编辑
2025年12月29日 — Google通过一项新功能展示了Gemini的照片编辑能力。
Turn one image into an entire photoshoot. Edit the angle, lighting, lens and so much more.
🇨🇳 将一张图片变成整个照片拍摄。编辑角度、光线、镜头等等。 — @GeminiApp on X
功能
从单张图片中,Gemini可以生成以下变体:
- 不同的角度(正面、侧面、俯视…)
- 多样的光线(摄影棚、自然、戏剧性…)
- 镜头风格(广角、人像、微距…)
- 多种氛围
应用
特别适用于:
- 电商:创建多个产品视图
- 创意人员:快速探索变体
- 社交媒体:生成多样化内容
本周总结
| 日期 | 公司 | 新闻 |
|---|---|---|
| 12/29 | Gemini 多角度照片编辑 | |
| 12/27 | Anthropic | Max 5倍促销修复 |
| 12/24 | Anthropic | 假期Pro/Max 2倍用量 |
| 12/24 | Mistral | Vibe CLI的Skills |
| 12/23 | Qwen | Qwen3-TTS (VoiceDesign + VoiceClone) |
| 12/23 | Qwen | Qwen-Image-Edit-2511 |
| 12/22 | OpenAI | ChatGPT Atlas代理安全 |