由 NVIDIA 開發的商業友善小型語言模型,針對角色扮演、RAG QA 和函數呼叫進行了最佳化。

工具 4b

59.3K 4 個月前

讀我檔案

Nemotron-Mini-4B-Instruct 是一個模型,用於為角色扮演、檢索增強生成和函數呼叫生成回應。它是一個小型語言模型 (SLM),通過蒸餾、剪枝和量化進行了最佳化,以實現速度和裝置上部署。

這個 instruct 模型針對英文的角色扮演、RAG QA 和函數呼叫進行了最佳化。它支援 4,096 個 tokens 的上下文長度。此模型已準備好用於商業用途。

參考文獻

部落格

HuggingFace