nemotron-mini:4b-instruct-q5_K_M - Ollama 框架

nemotron-mini

NVIDIA 出品的商業友善小型語言模型，針對角色扮演、RAG QA 和函數呼叫進行了最佳化。

工具 4b

70K 下載次數更新於 5 個月前

更新於 5 個月前

5 個月前

9e36e563dbdd · 3.1GB

parameters4.19B

quantizationQ5_K_M

{{- if (or .Tools .System) }}<extra_id_0>System {{ if .System }}{{ .System }} {{ end }} {{- if .To

NVIDIA AI Foundation Models 社群授權協議重要事項 – 請閱讀並同意 B

讀我檔案

Nemotron-Mini-4B-Instruct 是一個模型，用於為角色扮演、檢索增強生成和函數呼叫生成回應。它是一個小型語言模型 (SLM)，通過蒸餾、剪枝和量化進行了最佳化，以實現速度和裝置端部署。

這個 instruct 模型針對英文的角色扮演、RAG QA 和函數呼叫進行了最佳化。它支援 4,096 個 tokens 的上下文長度。這個模型已準備好用於商業用途。

參考資料