Mistral Large 2 是 Mistral 全新旗艦模型,在程式碼生成、數學和推理方面能力顯著提升,具備 128k 上下文視窗並支援數十種語言。

工具 123b

125.1K 3 個月前

說明文件

Mistral-Large-Instruct-2411 是一款先進的密集型大型語言模型 (LLM),擁有 123B 參數,具備最先進的推理、知識和編碼能力。

主要特色

  • 多語言設計:支援數十種語言,包括英語、法語、德語、西班牙語、義大利語、中文、日語、韓語、葡萄牙語、荷蘭語和波蘭語。
  • 精通編碼:在 80 多種編碼語言上進行訓練,例如 Python、Java、C、C++、JavacScript 和 Bash。 也在更特定的語言(如 Swift 和 Fortran)上進行了訓練。
  • 以代理為中心:具備頂尖的代理能力,支援原生函數呼叫和 JSON 輸出。
  • 進階推理:最先進的數學和推理能力。
  • Mistral 研究許可證:允許使用和修改於研究和非商業用途。
  • 大型上下文:大型 128k 上下文視窗。

參考資料

部落格文章

Hugging Face