說明文件
Mistral AI 正將 Mathstral 貢獻給科學社群,以加強在需要複雜、多步驟邏輯推理的高等數學問題上的研究。 Mathstral 的發布是他們支持學術專案的更廣泛努力的一部分——它是在 Mistral AI 與 Numina 專案合作的背景下產生的。
就像當年的艾薩克·牛頓一樣,Mathstral 站在 Mistral 7B 的肩膀上,並且專精於 STEM 領域。它在其尺寸類別中,在各種行業標準基準測試中,都達到了最先進的推理能力。
基準測試
Mathstral 可以通過更多的推理時間計算獲得顯著更好的結果:Mathstral 7B 在 MATH 基準測試中,以多數投票獲得 68.37% 的分數;並且在使用 64 個候選者中的強獎勵模型時,獲得 74.59% 的分數。