中型是新的大型。

Mistral Medium 3 以先进的性能和 8 倍更低的成本,通过极大简化的企业部署实现目标。

研究
2025年5月7日Mistral AI

在 Mistral AI,我们不断推动开放模型(Mistral Small、Mistral Large、Pixtral 等众多模型)和企业模型(Mistral OCR、Mistral Saba、Ministral 3B/8B 等)的界限。从 Mistral 7B 开始,我们的模型始终表现出远超重量级和更昂贵模型的性能。今天,我们很高兴地宣布 Mistral Medium 3,它将语言模型的效率和可用性推向了新的高度。

亮点。

  1. Mistral Medium 3 推出了一类新的模型,它平衡了

    • 最先进的性能

    • 成本降低 8 倍

    • 更简单的部署,以加速企业使用

  2. 该模型在编码和多模态理解等专业用例中表现出色

  3. 该模型提供一系列企业功能,包括

    • 混合或本地/VPC 内部署

    • 自定义后训练

    • 集成到企业工具和系统中

完美的平衡。

Mistral Medium 3 提供了前沿性能,同时成本降低了一个数量级。例如,在各种基准测试中,该模型性能达到或超过 Claude Sonnet 3.7 的 90%,而成本显著降低(每百万 token 输入 $0.4 / 输出 $2)。

在性能方面,Mistral Medium 3 还超越了领先的开放模型,如 Llama 4 Maverick,以及企业模型,如 Cohere Command A。在定价方面,该模型在 API 和自部署系统中都击败了成本领先者,如 DeepSeek v3。

此外,Mistral Medium 3 还可以部署在任何云端,包括四块及以上 GPU 的自托管环境。

顶尖性能。

Mistral Medium 3 旨在成为前沿级别模型,尤其是在专业用途类别中。在以下评估中,我们尽可能使用其他提供商之前报告的数据,否则使用我们自己的评估工具。所有基准测试的性能准确率均通过相同的内部评估流程获得。Mistral Medium 3 在编码和 STEM 任务中表现尤为突出,其性能接近其非常大型且慢得多的竞争对手。

Table Medium 6

*所有基准测试的性能准确率均通过相同的内部评估流程获得。

人工评估

除了学术基准测试外,我们还报告了更具代表性、反映真实世界用例的第三方人工评估。Mistral Medium 3 继续在编码领域表现出色,在各个方面都提供了比其一些大型竞争对手好得多的性能。

Side by Side Surge Human Evals Coding

Side by Side Surge Human Evals (1)

专为企业用例构建。

Mistral Medium 3 在适应企业环境的能力方面优于其他最先进的模型。在一个组织不得不在通过 API 进行微调或从头开始自部署和定制模型行为之间做出选择的世界中,Mistral Medium 3 提供了一条将智能全面集成到企业系统的途径。借助 Mistral 的应用 AI 解决方案,该模型可以持续进行预训练、完全微调并融入企业知识库,使其成为领域特定训练、持续学习和自适应工作流的高保真解决方案。来自金融服务、能源和医疗保健领域的 Beta 客户正在使用该模型,通过深层上下文丰富客户服务、个性化业务流程和分析复杂数据集。

今日可用。

Mistral Medium 3 API 今日起可在 Mistral La Plateforme 和 Amazon Sagemaker 上使用,并将很快在 IBM WatsonX、NVIDIA NIM、Azure AI Foundry 和 Google Cloud Vertex 上推出。如需在您的环境中部署和定制模型,请联系我们

还有一件事…

随着 Mistral Small 在三月和 Mistral Medium 在今日发布,我们在未来几周内正在开发‘大型’模型已不是秘密。即使是我们的中型模型也比 Llama 4 Maverick 等旗舰开源模型表现得更好,我们很高兴能‘揭示’即将到来的惊喜 :)