搜索

Qwen 2025:阿里巴巴在开源AI领域的迅猛崛起

Qwen 2025:阿里巴巴在开源AI领域的迅猛崛起

2025:Qwen不可或缺的一年

2025年,阿里云将Qwen从一个充满希望的项目转变为全球开源AI的标杆。从语言模型到代码工具,再到多模态和图像生成,Qwen生态系统现已覆盖AI的全谱系。


一月:Qwen2.5-Max挑战DeepSeek

2025年1月28日 — 阿里巴巴发布了Qwen2.5-Max,这是一个在超过20万亿token上训练的MoE(混合专家)模型。

BenchmarkQwen2.5-MaxDeepSeek V3
Arena-Hard更优-
LiveBench更优-
LiveCodeBench更优-
GPQA-Diamond更优-
MMLU-Pro具竞争力-

此次发布立即将Qwen定位为专有模型的有力竞争者。

🔗 官方公告


三月:多模态模型Qwen2.5-Omni

2025年3月27日Qwen2.5-Omni-7B问世,这是一款能够同时处理文本、图像、音频和视频的模型。

Thinker-Talker架构

组件角色
Thinker处理多模态输入
Talker生成流式语音响应
TMRoPE在时间上同步视频和音频

这款7B参数的模型提供了具有自然语音合成的实时对话功能,可与大得多的模型相媲美。

🔗 官方公告


四月:Qwen3彻底改变开源

2025年4月29日Qwen3家族携全系列模型登场。

稠密(Dense)模型

模型参数上下文
Qwen3-32B32B128K
Qwen3-14B14B128K
Qwen3-8B8B128K
Qwen3-4B4B32K
Qwen3-1.7B1.7B32K
Qwen3-0.6B0.6B32K

MoE模型

模型总计激活上下文
Qwen3-235B-A22B235B22B128K
Qwen3-30B-A3B30B3B128K

关键创新

  • 36万亿训练token(Qwen2.5的2倍)
  • 支持119种语言
  • 混合思维模式:深度推理或快速响应
  • 性能媲美DeepSeek-R1、o1和o3-mini

🔗 官方公告


七月:Qwen3-Coder与CLI

2025年7月22日 — 阿里巴巴发布了其最强大的代码模型:Qwen3-Coder-480B-A35B

规格

方面详情
总参数480B
激活参数35B
原生上下文256K token
扩展上下文1M token (YaRN)
代码数据7.5T token (70% 代码)

性能

在开源模型中处于State-of-the-art水平:

  • Agentic Coding:媲美Claude Sonnet 4
  • Agentic Browser-Use
  • Agentic Tool-Use
  • SWE-Bench Verified:测试时无扩展(scaling)

Qwen Code CLI

阿里巴巴还推出了Qwen Code,这是Gemini CLI的一个开源分支:

npm i -g @qwen-code/qwen-code

兼容Claude Code、Cline以及阿里云的DashScope API。

🔗 官方公告


七月:Qwen-MT翻译模型

2025年7月24日Qwen-MT用于多语言翻译。

  • 支持92种官方语言和方言
  • 高质量翻译
  • 针对速度进行了优化

🔗 官方公告


八月:Qwen-Image图像生成

2025年8月4日Qwen-Image是基于MMDiT架构的20B参数基础模型。

亮点

  • 原生文本渲染:多行文本、语义段落
  • 精确图像编辑
  • 优化的MMDiT架构

2025年8月19日Qwen-Image-Edit将这些能力扩展到图像编辑,结合了用于语义控制的Qwen2.5-VL和用于外观的VAE编码器。

🔗 Qwen-Image | Qwen-Image-Edit


九月:Qwen3Guard安全模型

2025年9月23日Qwen3Guard是Qwen家族的第一个安全模型。

功能描述
实时检测提示词和响应分析
风险等级分级分类
风险类别分类检测
多语言英语、中文、其他语言

该模型允许在基于Qwen的应用程序中集成安全护栏。

🔗 官方公告


2025年发布回顾

日期发布类型
1月28日Qwen2.5-MaxLLM MoE
3月27日Qwen2.5-Omni-7B多模态
4月29日Qwen3 (8款模型)LLM
7月22日Qwen3-Coder-480B代码
7月22日Qwen Code CLI工具
7月24日Qwen-MT翻译
8月4日Qwen-Image图像生成
8月19日Qwen-Image-Edit图像编辑
9月23日Qwen3Guard安全

这意味着什么

2025年,阿里巴巴证明了开源AI生态系统可以与专有巨头抗衡。凭借涵盖语言、代码、多模态、图像和安全的模型,Qwen提供了一个完整且可访问的替代方案。

阿里巴巴的战略——在开放许可下发布高性能模型——加速了采用和创新,同时使尖端AI技术的获取民主化。


来源