讀我檔案
Mistral AI 正向科學社群貢獻 Mathstral,旨在強化需要複雜、多步驟邏輯推理之高等數學問題的研究工作。Mathstral 的發布是其支持學術專案更廣泛計畫的一環,源於 Mistral AI 與 Project Numina 的合作。
如同當年的艾薩克·牛頓,Mathstral 站在 Mistral 7B 的基礎上,專精於 STEM 領域。 在其模型尺寸類別中,Mathstral 的推理能力已臻最先進水準,並於多項業界標準評測中展現優異效能。
基準測試
Mathstral 可透過增加推論運算時間,顯著提升效能:Mathstral 7B 模型在 MATH 基準測試中,以多數投票機制獲得 68.37% 的成績;若採用包含 64 個候選模型之強大的獎勵模型,則可達到 74.59% 的優異表現。