2025:Qwen不可或缺的一年
2025年,阿里云将Qwen从一个充满希望的项目转变为全球开源AI的标杆。从语言模型到代码工具,再到多模态和图像生成,Qwen生态系统现已覆盖AI的全谱系。
一月:Qwen2.5-Max挑战DeepSeek
2025年1月28日 — 阿里巴巴发布了Qwen2.5-Max,这是一个在超过20万亿token上训练的MoE(混合专家)模型。
| Benchmark | Qwen2.5-Max | DeepSeek V3 |
|---|---|---|
| Arena-Hard | 更优 | - |
| LiveBench | 更优 | - |
| LiveCodeBench | 更优 | - |
| GPQA-Diamond | 更优 | - |
| MMLU-Pro | 具竞争力 | - |
此次发布立即将Qwen定位为专有模型的有力竞争者。
🔗 官方公告
三月:多模态模型Qwen2.5-Omni
2025年3月27日 — Qwen2.5-Omni-7B问世,这是一款能够同时处理文本、图像、音频和视频的模型。
Thinker-Talker架构
| 组件 | 角色 |
|---|---|
| Thinker | 处理多模态输入 |
| Talker | 生成流式语音响应 |
| TMRoPE | 在时间上同步视频和音频 |
这款7B参数的模型提供了具有自然语音合成的实时对话功能,可与大得多的模型相媲美。
🔗 官方公告
四月:Qwen3彻底改变开源
2025年4月29日 — Qwen3家族携全系列模型登场。
稠密(Dense)模型
| 模型 | 参数 | 上下文 |
|---|---|---|
| Qwen3-32B | 32B | 128K |
| Qwen3-14B | 14B | 128K |
| Qwen3-8B | 8B | 128K |
| Qwen3-4B | 4B | 32K |
| Qwen3-1.7B | 1.7B | 32K |
| Qwen3-0.6B | 0.6B | 32K |
MoE模型
| 模型 | 总计 | 激活 | 上下文 |
|---|---|---|---|
| Qwen3-235B-A22B | 235B | 22B | 128K |
| Qwen3-30B-A3B | 30B | 3B | 128K |
关键创新
- 36万亿训练token(Qwen2.5的2倍)
- 支持119种语言
- 混合思维模式:深度推理或快速响应
- 性能媲美DeepSeek-R1、o1和o3-mini
🔗 官方公告
七月:Qwen3-Coder与CLI
2025年7月22日 — 阿里巴巴发布了其最强大的代码模型:Qwen3-Coder-480B-A35B。
规格
| 方面 | 详情 |
|---|---|
| 总参数 | 480B |
| 激活参数 | 35B |
| 原生上下文 | 256K token |
| 扩展上下文 | 1M token (YaRN) |
| 代码数据 | 7.5T token (70% 代码) |
性能
在开源模型中处于State-of-the-art水平:
- Agentic Coding:媲美Claude Sonnet 4
- Agentic Browser-Use
- Agentic Tool-Use
- SWE-Bench Verified:测试时无扩展(scaling)
Qwen Code CLI
阿里巴巴还推出了Qwen Code,这是Gemini CLI的一个开源分支:
npm i -g @qwen-code/qwen-code
兼容Claude Code、Cline以及阿里云的DashScope API。
🔗 官方公告
七月:Qwen-MT翻译模型
2025年7月24日 — Qwen-MT用于多语言翻译。
- 支持92种官方语言和方言
- 高质量翻译
- 针对速度进行了优化
🔗 官方公告
八月:Qwen-Image图像生成
2025年8月4日 — Qwen-Image是基于MMDiT架构的20B参数基础模型。
亮点
- 原生文本渲染:多行文本、语义段落
- 精确图像编辑
- 优化的MMDiT架构
2025年8月19日 — Qwen-Image-Edit将这些能力扩展到图像编辑,结合了用于语义控制的Qwen2.5-VL和用于外观的VAE编码器。
🔗 Qwen-Image | Qwen-Image-Edit
九月:Qwen3Guard安全模型
2025年9月23日 — Qwen3Guard是Qwen家族的第一个安全模型。
| 功能 | 描述 |
|---|---|
| 实时检测 | 提示词和响应分析 |
| 风险等级 | 分级分类 |
| 风险类别 | 分类检测 |
| 多语言 | 英语、中文、其他语言 |
该模型允许在基于Qwen的应用程序中集成安全护栏。
🔗 官方公告
2025年发布回顾
| 日期 | 发布 | 类型 |
|---|---|---|
| 1月28日 | Qwen2.5-Max | LLM MoE |
| 3月27日 | Qwen2.5-Omni-7B | 多模态 |
| 4月29日 | Qwen3 (8款模型) | LLM |
| 7月22日 | Qwen3-Coder-480B | 代码 |
| 7月22日 | Qwen Code CLI | 工具 |
| 7月24日 | Qwen-MT | 翻译 |
| 8月4日 | Qwen-Image | 图像生成 |
| 8月19日 | Qwen-Image-Edit | 图像编辑 |
| 9月23日 | Qwen3Guard | 安全 |
这意味着什么
2025年,阿里巴巴证明了开源AI生态系统可以与专有巨头抗衡。凭借涵盖语言、代码、多模态、图像和安全的模型,Qwen提供了一个完整且可访问的替代方案。
阿里巴巴的战略——在开放许可下发布高性能模型——加速了采用和创新,同时使尖端AI技术的获取民主化。