中型是新的大型。

Mistral Medium 3 以先进的性能和 8 倍更低的成本，通过极大简化的企业部署实现目标。

研究

2025年5月7日Mistral AI

在 Mistral AI，我们不断推动开放模型（Mistral Small、Mistral Large、Pixtral 等众多模型）和企业模型（Mistral OCR、Mistral Saba、Ministral 3B/8B 等）的界限。从 Mistral 7B 开始，我们的模型始终表现出远超重量级和更昂贵模型的性能。今天，我们很高兴地宣布 Mistral Medium 3，它将语言模型的效率和可用性推向了新的高度。

亮点。

Mistral Medium 3 推出了一类新的模型，它平衡了

最先进的性能
成本降低 8 倍
更简单的部署，以加速企业使用

该模型在编码和多模态理解等专业用例中表现出色
该模型提供一系列企业功能，包括

混合或本地/VPC 内部署
自定义后训练
集成到企业工具和系统中

完美的平衡。

Mistral Medium 3 提供了前沿性能，同时成本降低了一个数量级。例如，在各种基准测试中，该模型性能达到或超过 Claude Sonnet 3.7 的 90%，而成本显著降低（每百万 token 输入 $0.4 / 输出 $2）。

在性能方面，Mistral Medium 3 还超越了领先的开放模型，如 Llama 4 Maverick，以及企业模型，如 Cohere Command A。在定价方面，该模型在 API 和自部署系统中都击败了成本领先者，如 DeepSeek v3。

此外，Mistral Medium 3 还可以部署在任何云端，包括四块及以上 GPU 的自托管环境。

顶尖性能。

Mistral Medium 3 旨在成为前沿级别模型，尤其是在专业用途类别中。在以下评估中，我们尽可能使用其他提供商之前报告的数据，否则使用我们自己的评估工具。所有基准测试的性能准确率均通过相同的内部评估流程获得。Mistral Medium 3 在编码和 STEM 任务中表现尤为突出，其性能接近其非常大型且慢得多的竞争对手。

Table Medium 6

*所有基准测试的性能准确率均通过相同的内部评估流程获得。

人工评估

除了学术基准测试外，我们还报告了更具代表性、反映真实世界用例的第三方人工评估。Mistral Medium 3 继续在编码领域表现出色，在各个方面都提供了比其一些大型竞争对手好得多的性能。

Side by Side Surge Human Evals Coding

Side by Side Surge Human Evals (1)

专为企业用例构建。

Mistral Medium 3 在适应企业环境的能力方面优于其他最先进的模型。在一个组织不得不在通过 API 进行微调或从头开始自部署和定制模型行为之间做出选择的世界中，Mistral Medium 3 提供了一条将智能全面集成到企业系统的途径。借助 Mistral 的应用 AI 解决方案，该模型可以持续进行预训练、完全微调并融入企业知识库，使其成为领域特定训练、持续学习和自适应工作流的高保真解决方案。来自金融服务、能源和医疗保健领域的 Beta 客户正在使用该模型，通过深层上下文丰富客户服务、个性化业务流程和分析复杂数据集。

今日可用。

Mistral Medium 3 API 今日起可在 Mistral La Plateforme 和 Amazon Sagemaker 上使用，并将很快在 IBM WatsonX、NVIDIA NIM、Azure AI Foundry 和 Google Cloud Vertex 上推出。如需在您的环境中部署和定制模型，请联系我们。

还有一件事…

随着 Mistral Small 在三月和 Mistral Medium 在今日发布，我们在未来几周内正在开发‘大型’模型已不是秘密。即使是我们的中型模型也比 Llama 4 Maverick 等旗舰开源模型表现得更好，我们很高兴能‘揭示’即将到来的惊喜 :)