MathΣtral:由 Mistral AI 設計的 7B 模型,用於數學推理和科學發現。

7b

32.7K 7 個月前

自述檔案

Mistral AI 將 Mathstral 貢獻給科學社群,以加強在需要複雜、多步驟邏輯推理的高等數學問題上的努力。Mathstral 的發布是他們支持學術專案的更廣泛努力的一部分——它是在 Mistral AI 與 Numina 專案合作的背景下產生的。

Mathstral 如同他那個時代的艾薩克·牛頓一樣,站在 Mistral 7B 的肩膀上,專注於 STEM 學科。它在各種行業標準基準測試中,在其規模類別中實現了最先進的推理能力。

mathstral-breakdown.png

基準測試

Mathstral 可以通過更多的推理時間計算獲得顯著更好的結果:Mathstral 7B 在 MATH 上以多數投票獲得 68.37% 的分數,在 64 個候選者中使用強大的獎勵模型獲得 74.59% 的分數。

mathstral-benchmarks.png

參考文獻

部落格文章

Hugging Face