Mistral Large 2 是 Mistral 全新的旗艦模型,在程式碼生成、數學和推理方面能力顯著提升,並具備 128k 上下文視窗和支援數十種語言。

工具 123b

125.1K 3 個月前

說明文件

Mistral-Large-Instruct-2411 是一個先進的密集大型語言模型 (LLM),具有 123B 參數,並具備最先進的推理、知識和編碼能力。

主要特色

  • 多語言設計:支援數十種語言,包括英文、法文、德文、西班牙文、義大利文、中文、日文、韓文、葡萄牙文、荷蘭文和波蘭文。
  • 精通編碼:在 80 多種編碼語言上進行訓練,例如 Python、Java、C、C++、JavaScript 和 Bash。也在更特定的語言上進行訓練,例如 Swift 和 Fortran。
  • 以代理為中心:具有一流的代理能力,支援原生函式呼叫和 JSON 輸出。
  • 進階推理:最先進的數學和推理能力。
  • Mistral 研究授權:允許用於研究和非商業用途的使用和修改。
  • 大上下文:大型 128k 上下文視窗。

參考資料

部落格文章

Hugging Face