Mistral Large 2 是 Mistral 全新的旗艦模型,在程式碼生成、數學和推理方面能力顯著提升,並具備 128k 上下文窗口,且支援數十種語言。

工具 123b

125.1K 3 個月前

說明文件

Mistral-Large-Instruct-2411 是一個先進的稠密型大語言模型 (LLM),具有 123 億個參數,並具備最先進的推理、知識和編碼能力。

主要特色

  • 多語言設計:支援數十種語言,包括英語、法語、德語、西班牙語、義大利語、中文、日語、韓語、葡萄牙語、荷蘭語和波蘭語。
  • 精通程式設計:在 80 多種程式碼語言上進行訓練,例如 Python、Java、C、C++、JavaScript 和 Bash。 也在更特定的語言(如 Swift 和 Fortran)上進行訓練。
  • 以代理為中心:具有同類最佳的代理功能,支援原生函數呼叫和 JSON 輸出。
  • 進階推理:最先進的數學和推理能力。
  • Mistral 研究許可證:允許為了研究和非商業用途而使用和修改。
  • 大型上下文:大型 128k 上下文窗口。

參考文獻

部落格文章

Hugging Face