NVIDIA 的商業友善小型語言模型,專為角色扮演、RAG QA 和函數呼叫優化。

工具 4b

70K 5 個月前

說明文件

Nemotron-Mini-4B-Instruct 是一個模型,用於為角色扮演、RAG 和函數呼叫產生回應。它是一個小型語言模型 (SLM),經由蒸餾、剪枝和量化優化,以提升速度和便於裝置端部署。

這個 instruct 模型專為英文角色扮演、RAG QA 和函數呼叫進行了優化。它支援 4,096 個 token 的上下文長度。此模型已可商業使用。

參考資料

部落格

HuggingFace