Mistral Large 2 是 Mistral 全新的旗艦模型,在程式碼生成、數學和推理方面顯著更強大,具有 128k 上下文窗口並支援數十種語言。

工具 123b

125.1K 3 個月前

自述

Mistral-Large-Instruct-2411 是一個先進的密集型大型語言模型 (LLM),具有 123B 參數,並具備最先進的推理、知識和編碼能力。

主要特色

  • 多語言設計:支援數十種語言,包括英語、法語、德語、西班牙語、義大利語、中文、日語、韓語、葡萄牙語、荷蘭語和波蘭語。
  • 精通編碼:在 80 多種編碼語言上進行訓練,例如 Python、Java、C、C++、JavacScript 和 Bash。 還在更特定的語言(如 Swift 和 Fortran)上進行了訓練。
  • 以代理為中心:一流的代理功能,具有原生函數呼叫和 JSON 輸出。
  • 進階推理:最先進的數學和推理能力。
  • Mistral 研究許可證:允許用於研究和非商業用途的使用和修改。
  • 大型上下文:大型 128k 上下文窗口。

參考文獻

部落格文章

Hugging Face