MathΣtral

为纪念阿基米德诞辰 2311 周年(今年适逢其诞辰),我们自豪地发布了我们的首个 Mathstral 模型,这是一个专为数学推理和科学发现设计的特定 7B 模型。该模型具有 32k 上下文窗口,并在 Apache 2.0 许可下发布。

研究
2024年7月16日Mistral AI 团队

我们将 Mathstral 贡献给科学界,以支持需要复杂多步骤逻辑推理的高级数学问题的研究工作。Mathstral 的发布是我们更广泛的支持学术项目努力的一部分——它是在我们与 Project Numina 合作的背景下产生的。

就像他那个时代的艾萨克·牛顿一样,Mathstral 在 Mistral 7B 的基础上发展而来,并专注于 STEM 学科。它在各种行业标准基准测试中,在其规模类别内实现了最先进的推理能力。特别是,它在 MATH 上达到了 56.6%,在 MMLU 上达到了 63.47%,以下是 Mathstral 7B 和 Mistral 7B 在 MMLU 上按学科划分的性能差异。

Mathstral 7B breakdown by subject

Mathstral 是为特定目的构建模型时实现出色性能/速度权衡的又一个例子——这是我们在 la Plateforme 中积极推崇的开发理念,特别是通过其新的微调能力

Mathstral 7B detailed benchmarks

Mathstral 可以通过更多的推理时计算获得显著更好的结果:Mathstral 7B 在 MATH 上通过多数投票获得了 68.37% 的分数,通过强大的奖励模型(在 64 个候选结果中)获得了 74.59% 的分数。

Mathstral 是一个指令模型——请参考我们的文档来使用或微调它。权重托管在 HuggingFace 上。您现在可以使用 mistral-inference 尝试 Mathstral,并使用 mistral-finetune 对其进行调整。

我们感谢 Paul Bourdon 教授对我们在评估中使用的 GRE 数学科目测试问题的整理工作。

人工智能的下一个篇章由您书写。