MathΣtral:由 Mistral AI 開發,專為數學推理和科學發現而設計的 7B 模型。

7b

29.9K 6 個月前

讀我

Mistral AI 正將 Mathstral 貢獻給科學社群,以加強在需要複雜、多步驟邏輯推理的高階數學問題上的研究。Mathstral 的發布是他們支持學術專案的更廣泛努力的一部分——它是 Mistral AI 與 Project Numina 合作背景下產生的。

就像當時的艾薩克·牛頓一樣,Mathstral 站在 Mistral 7B 的肩膀上,並且專注於 STEM(科學、技術、工程和數學)科目。它在其尺寸類別中,在各種行業標準基準測試中,都達到了最先進的推理能力。

mathstral-breakdown.png

基準測試

Mathstral 可以透過更多的推理時間計算,獲得顯著更好的結果:Mathstral 7B 在 MATH 基準測試中,以多數投票獲得 68.37% 的分數,而在 64 名候選者中使用強大的獎勵模型則獲得 74.59% 的分數。

mathstral-benchmarks.png

參考文獻

部落格文章

Hugging Face