NVIDIA 出品,適用於商業用途的小型語言模型,針對角色扮演、RAG QA 和函式呼叫進行了最佳化。

工具 4b

70K 5 個月前

讀我檔案

Nemotron-Mini-4B-Instruct 是一個用於為角色扮演、檢索增強生成和函式呼叫產生回應的模型。它是一個小型語言模型 (SLM),透過蒸餾、剪枝和量化進行了最佳化,以提高速度和在裝置上的部署能力。

此 instruct 模型針對英文的角色扮演、RAG QA 和函式呼叫進行了最佳化。它支援 4,096 個 token 的上下文長度。此模型已可供商業用途使用。

參考資料

部落格

HuggingFace