2025년: Qwen이 필수가 된 해
2025년, Alibaba Cloud는 Qwen을 유망한 프로젝트에서 오픈 소스 AI의 세계적인 벤치마크로 탈바꿈시켰습니다. 언어 모델에서 코드 도구, 멀티모달 및 이미지 생성에 이르기까지 Qwen 생태계는 이제 전체 AI 스펙트럼을 포괄합니다.
1월: Qwen2.5-Max가 DeepSeek에 도전하다
2025년 1월 28일 — Alibaba는 20조 개 이상의 token으로 훈련된 MoE(Mixture of Experts) 모델인 Qwen2.5-Max를 출시했습니다.
| Benchmark | Qwen2.5-Max | DeepSeek V3 |
|---|---|---|
| Arena-Hard | 우수함 | - |
| LiveBench | 우수함 | - |
| LiveCodeBench | 우수함 | - |
| GPQA-Diamond | 우수함 | - |
| MMLU-Pro | 경쟁력 있음 | - |
이번 출시는 즉시 Qwen을 독점 모델의 심각한 경쟁자로 자리매김했습니다.
🔗 공식 발표
3월: Qwen2.5-Omni를 통한 멀티모달
2025년 3월 27일 — 텍스트, 이미지, 오디오 및 비디오를 동시에 처리할 수 있는 모델인 Qwen2.5-Omni-7B가 도착했습니다.
Thinker-Talker 아키텍처
| 구성 요소 | 역할 |
|---|---|
| Thinker | 멀티모달 입력을 처리합니다 |
| Talker | 스트리밍 음성 응답을 생성합니다 |
| TMRoPE | 비디오와 오디오를 시간적으로 동기화합니다 |
이 7B 매개변수 모델은 자연스러운 음성 합성을 통한 실시간 대화를 제공하며 훨씬 더 큰 모델과 경쟁합니다.
🔗 공식 발표
4월: Qwen3가 오픈 소스에 혁명을 일으키다
2025년 4월 29일 — Qwen3 제품군이 다양한 모델과 함께 출시되었습니다.
Dense 모델
| 모델 | 매개변수 | 컨텍스트 |
|---|---|---|
| Qwen3-32B | 32B | 128K |
| Qwen3-14B | 14B | 128K |
| Qwen3-8B | 8B | 128K |
| Qwen3-4B | 4B | 32K |
| Qwen3-1.7B | 1.7B | 32K |
| Qwen3-0.6B | 0.6B | 32K |
MoE 모델
| 모델 | 전체 | 활성 | 컨텍스트 |
|---|---|---|---|
| Qwen3-235B-A22B | 235B | 22B | 128K |
| Qwen3-30B-A3B | 30B | 3B | 128K |
주요 혁신
- 36조 개의 훈련 token (Qwen2.5의 2배)
- 119개 언어 지원
- 하이브리드 사고 모드: 깊은 추론 또는 빠른 응답
- DeepSeek-R1, o1 및 o3-mini와 유사한 성능
🔗 공식 발표
7월: Qwen3-Coder 및 CLI
2025년 7월 22일 — Alibaba는 가장 강력한 코드 모델인 Qwen3-Coder-480B-A35B를 출시했습니다.
사양
| 측면 | 세부 정보 |
|---|---|
| 전체 매개변수 | 480B |
| 활성 매개변수 | 35B |
| 기본 컨텍스트 | 256K token |
| 확장 컨텍스트 | 1M token (YaRN) |
| 코드 데이터 | 7.5T token (코드 70%) |
성능
다음 항목에서 오픈 소스 모델 중 State-of-the-art:
- Agentic Coding: Claude Sonnet 4와 비슷함
- Agentic Browser-Use
- Agentic Tool-Use
- SWE-Bench Verified: 테스트 시 스케일링 없음
Qwen Code CLI
Alibaba는 또한 Gemini CLI의 오픈 소스 포크인 Qwen Code를 출시했습니다:
npm i -g @qwen-code/qwen-code
Claude Code, Cline 및 Alibaba Cloud의 DashScope API와 호환됩니다.
🔗 공식 발표
7월: Qwen-MT를 통한 번역
2025년 7월 24일 — 다국어 번역을 위한 Qwen-MT가 도착했습니다.
- 92개 공식 언어 및 방언 지원
- 고품질 번역
- 속도에 최적화됨
🔗 공식 발표
8월: Qwen-Image를 통한 이미지 생성
2025년 8월 4일 — Qwen-Image는 MMDiT 아키텍처를 기반으로 하는 20B 매개변수 파운데이션 모델입니다.
주요 특징
- 네이티브 텍스트 렌더링: 여러 줄 텍스트, 의미론적 단락
- 정밀한 이미지 편집
- 최적화된 MMDiT 아키텍처
2025년 8월 19일 — Qwen-Image-Edit는 의미 제어를 위한 Qwen2.5-VL과 외관을 위한 VAE 인코더를 결합하여 이러한 기능을 이미지 편집으로 확장합니다.
🔗 Qwen-Image | Qwen-Image-Edit
9월: Qwen3Guard를 통한 보안
2025년 9월 23일 — Qwen3Guard는 Qwen 제품군의 첫 번째 보안 모델입니다.
| 기능 | 설명 |
|---|---|
| 실시간 감지 | 프롬프트 및 응답 분석 |
| 위험 수준 | 등급별 분류 |
| 위험 카테고리 | 카테고리별 감지 |
| 다국어 | 영어, 중국어, 기타 언어 |
이 모델을 사용하면 Qwen 기반 애플리케이션에 보안 가드레일을 통합할 수 있습니다.
🔗 공식 발표
2025년 출시 요약
| 날짜 | 출시 | 유형 |
|---|---|---|
| 1/28 | Qwen2.5-Max | LLM MoE |
| 3/27 | Qwen2.5-Omni-7B | 멀티모달 |
| 4/29 | Qwen3 (8개 모델) | LLM |
| 7/22 | Qwen3-Coder-480B | 코드 |
| 7/22 | Qwen Code CLI | 도구 |
| 7/24 | Qwen-MT | 번역 |
| 8/4 | Qwen-Image | 이미지 생성 |
| 8/19 | Qwen-Image-Edit | 이미지 편집 |
| 9/23 | Qwen3Guard | 보안 |
이것이 의미하는 바
2025년, Alibaba는 오픈 소스 AI 생태계가 독점 기업과 경쟁할 수 있음을 입증했습니다. 언어, 코드, 멀티모달, 이미지 및 보안을 아우르는 모델을 갖춘 Qwen은 완전하고 접근 가능한 대안을 제공합니다.
고성능 모델을 오픈 라이선스로 공개하는 Alibaba의 전략은 채택과 혁신을 가속화하는 동시에 최첨단 AI 기술에 대한 접근을 민주화하고 있습니다.