4 個月前更新
4 個月前
ed76ab18784f · 2.7GB
模型
archnemotron
·
parameters4.19B
·
quantizationQ4_K_M
2.7GB
範本
{{- if (or .Tools .System) }}<extra_id_0>System {{ if .System }}{{ .System }} {{ end }} {{- if .To
773B
授權
NVIDIA AI Foundation Models Community License Agreement IMPORTANT NOTICE – PLEASE READ AND AGREE B
15kB
讀我
Nemotron-Mini-4B-Instruct 是一個用於為角色扮演、檢索增強生成和函數呼叫產生回應的模型。它是一個小型語言模型 (SLM),透過蒸餾、剪枝和量化進行了最佳化,以實現速度和裝置端部署。
此 instruct 模型針對英文的角色扮演、RAG QA 和函數呼叫進行了最佳化。它支援 4,096 個 token 的上下文長度。此模型已準備好用於商業用途。