由 Mistral AI 與 NVIDIA 合作建構的先進 12B 模型,具備 128k 上下文長度。

工具 12b

1.3M 7 個月前

Readme

Mistral NeMo 是一個與 NVIDIA 合作建構的 12B 模型。Mistral NeMo 提供高達 128k tokens 的大型上下文視窗。其推理、世界知識和程式碼準確性在其尺寸類別中堪稱最先進。由於它依賴標準架構,Mistral NeMo 易於使用,並且是在任何使用 Mistral 7B 的系統中的直接替換。

nemo-base-performance.png

參考文獻

部落格

Hugging Face