Mistral Large 2 是 Mistral 全新的旗艦模型,在程式碼生成、數學和推理方面能力顯著提升,具備 128k 上下文視窗並支援數十種語言。

工具 123b

125.1K 3 個月前

Readme

Mistral-Large-Instruct-2411 是一款先進的密集型大型語言模型 (LLM),具有 123B 參數,並具備最先進的推理、知識和編碼能力。

主要特色

  • 多語言設計:支援數十種語言,包括英語、法語、德語、西班牙語、義大利語、中文、日語、韓語、葡萄牙語、荷蘭語和波蘭語。
  • 精通編碼:在 80 多種程式碼語言上進行訓練,例如 Python、Java、C、C++、JavacScript 和 Bash。 也針對更特定的語言(如 Swift 和 Fortran)進行訓練。
  • 以代理為中心:一流的代理功能,具有原生函式呼叫和 JSON 輸出。
  • 進階推理:最先進的數學和推理能力。
  • Mistral 研究授權條款:允許使用和修改以進行研究和非商業用途。
  • 大型上下文:大型 128k 上下文視窗。

參考文獻

部落格文章

Hugging Face