nemotron-mini:4b-instruct-q4_1 - Ollama 框架

nemotron-mini

NVIDIA 的商業友善小型語言模型，專為角色扮演、RAG QA 和函數呼叫優化。

工具 4b

70K 提取次數更新於 5 個月前

更新於 5 個月前

5 個月前

715f0114b145 · 2.8GB

{{- if (or .Tools .System) }}<extra_id_0>System {{ if .System }}{{ .System }} {{ end }} {{- if .To

NVIDIA AI 基礎模型社群授權協議重要聲明 – 請閱讀並同意 B

說明文件

Nemotron-Mini-4B-Instruct 是一個模型，用於為角色扮演、RAG 和函數呼叫產生回應。它是一個小型語言模型 (SLM)，經由蒸餾、剪枝和量化優化，以提升速度和便於裝置端部署。

這個 instruct 模型專為英文角色扮演、RAG QA 和函數呼叫進行了優化。它支援 4,096 個 token 的上下文長度。此模型已可商業使用。

參考資料