Mistral AI 决定性的一个月
2025年12月标志着 Mistral AI 的一个转折点,随着 Devstral 2 的推出,这是他们新的 coding agentic 模型,可与最好的模型相媲美,同时推出的还有 Mistral Vibe CLI,一个命令行 coding 代理。Mistral 3 系列通过开源多模态模型完善了产品线。
Devstral 2:参考级开源 coding 模型
2025年12月9日 — Mistral 推出 Devstral 2,这是一个 coding 模型系列,提供两种尺寸,均为开源。
🔗 官方公告
两种尺寸满足所有需求
| 模型 | 参数 | SWE-bench | API 价格 (input/output) | 许可证 |
|---|---|---|---|---|
| Devstral 2 | 123B | 72.2% | 2.00 per M tokens | 修改后的 MIT |
| Devstral Small 2 | 24B | 68.0% | 0.30 per M tokens | Apache 2.0 |
与竞争对手的性能对比
Devstral 2 以其高效率脱颖而出:
- 比 DeepSeek V3.2 小 5 倍
- 比 Kimi K2 小 28 倍
- 比 Claude Sonnet 性价比高出 7 倍
- 256K token 的上下文窗口
Introducing the Devstral 2 coding model family. Two sizes, both open source. Also, meet Mistral Vibe, a native CLI, enabling end-to-end automation.
🇨🇳 介绍 Devstral 2 coding 模型系列。两种尺寸,均为开源。同时请认识 Mistral Vibe,这是一个原生 CLI,可实现端到端自动化。 — @MistralAI on X
人类评估
| 对比对象 | 胜率 |
|---|---|
| DeepSeek V3.2 | 42.8% |
推荐部署
| 模型 | 最低配置 |
|---|---|
| Devstral 2 | 4 个 H100 级 GPU |
| Devstral Small 2 | 单个 GPU (RTX),DGX Spark 或仅 CPU |
Mistral Vibe CLI:终端中的 coding 代理
2025年12月9日 — 与 Devstral 2 一起,Mistral 推出了 Vibe,一个开源的命令行 coding 助手。
安装
curl -LsSf https://mistral.ai/vibe/install.sh | bash
或通过 uv:
uv tool install mistral-vibe
关键功能
| 功能 | 描述 |
|---|---|
| Project-aware context | 自动分析结构和 Git |
| 多文件编排 | 架构推理 |
| 智能引用 | @autocomplete,! 用于 shell |
| 持久历史 | 会话间保留上下文 |
| 可自定义主题 | 自适应界面 |
集成
- 提供 Zed IDE 扩展
- 可通过
config.toml配置 本地部署 - 兼容 OpenHands、Cline 和其他工具
200k 上下文更新
2025年12月10日 — Vibe 的上下文窗口从 100k 翻倍至 200k token。
We’ve doubled the Vibe context limit from 100k to 200k. Happy shipping!
🇨🇳 我们将 Vibe 的上下文限制从 100k 翻倍至 200k。祝开发愉快! — @MistralAI on X
Mistral 3:开源多模态模型系列
2025年12月2日 — Mistral 推出 Mistral 3 系列,这是具有多模态能力的开源 frontier 模型。
🔗 官方公告
完整系列
| 模型 | 架构 | 参数 | 重点 |
|---|---|---|---|
| Mistral Large 3 | Sparse MoE | 41B active / 675B total | 旗舰模型 |
| Ministral 14B | Dense | 14B | 高要求使用 |
| Ministral 8B | Dense | 8B | 平衡 |
| Ministral 3B | Dense | 3B | 边缘 / 移动 |
性能
- Mistral Large 3:在 LMArena 的 OSS non-reasoning 类别中排名第二
- Ministral:OSS 模型中最佳的性价比
- Ministral 的 reasoning 变体:在 AIME ‘25 上准确率达到 85% (14B)
共同特征
| 特征 | 描述 |
|---|---|
| 多模态 | 原生图像理解 |
| 多语言 | 40+ 种原生语言 |
| 变体 | Base, Instruct, Reasoning |
| 许可证 | Apache 2.0 |
可用性
- Mistral AI Studio
- Amazon Bedrock, Azure Foundry
- Hugging Face, Modal, IBM WatsonX
- OpenRouter, Fireworks
Mistral OCR 3:下一代文档处理
2025年12月17日 — Mistral 推出 OCR 3,这是一个专注于文档提取且具有顶尖精度的模型。
🔗 官方公告
性能
| 指标 | 数值 |
|---|---|
| OCR 2 胜率对比 | 74% |
| 专长 | 表单、表格、手写体 |
| 鲁棒性 | 压缩、倾斜、低质量扫描 |
定价
| 模式 | 价格 |
|---|---|
| API | $2 / 1000 页 |
| Batch | $1 / 1000 页 |
关键功能
- 手写体 — 包括草书和混合注释
- 表单 — 检测复选框、标签、密集布局
- 复杂表格 — 标题、合并单元格、HTML colspan/rowspan
- Markdown 输出 — 增强了 HTML 表格重建
可用性
- 通过模型
mistral-ocr-2512的 API - Mistral AI Studio 中的 Document AI Playground
这意味着什么
2025年12月证实了 Mistral AI 的战略:
- 具有竞争力的开源 — Devstral 2 和 Mistral 3 与专有模型竞争,同时保持 Apache 2.0 许可
- 开发者为中心 — Mistral Vibe CLI 为 Claude Code 和 Codex CLI 提供了一个可信的替代方案
- 完整生态系统 — 从 coding 模型到 OCR,Mistral 覆盖了越来越多的用例
- 效率 — 模型更小,但性能可与巨头媲美