自述文件
Mistral AI 正向科學社群貢獻 Mathstral,以支持需要複雜、多步驟邏輯推理的高階數學問題的研究。Mathstral 的發布是他們支持學術專案的更廣泛努力的一部分——它是在 Mistral AI 與 Project Numina 合作的背景下產生的。
Mathstral 如同其時代的艾薩克·牛頓,站在 Mistral 7B 的肩膀上,專注於 STEM 學科。它在各種行業標準基準測試中,在其尺寸類別中實現了最先進的推理能力。
基準測試
Mathstral 可以通過更多的推理時間計算獲得顯著更好的結果:Mathstral 7B 在 MATH 基準測試中,通過多數投票獲得 68.37% 的分數,通過強大的獎勵模型在 64 個候選者中獲得 74.59% 的分數。