一個最先進的 12B 模型,具有 128k 上下文長度,由 Mistral AI 與 NVIDIA 合作建構。

工具 12b

1.1M 6 個月前

讀我

Mistral NeMo 是一個 12B 模型,由 NVIDIA 合作建構。Mistral NeMo 提供高達 128k tokens 的大型上下文窗口。它的推理、世界知識和編碼準確性在其尺寸類別中是最先進的。由於它依賴標準架構,Mistral NeMo 易於使用,並且可以隨插即用替換任何使用 Mistral 7B 的系統。

nemo-base-performance.png

參考

部落格

Hugging Face