最先進的 12B 模型,具有 128k 上下文長度,由 Mistral AI 與 NVIDIA 合作建構。

tools 12b

1.3M 7 個月前

說明

Mistral NeMo 是一個與 NVIDIA 合作建構的 12B 模型。Mistral NeMo 提供高達 128k tokens 的大型上下文窗口。其推理能力、世界知識和程式碼準確性在其規模類別中處於最先進水平。由於它基於標準架構,Mistral NeMo 易於使用,並且可以作為任何使用 Mistral 7B 系統的直接替代品。

nemo-base-performance.png

參考

部落格

Hugging Face