deepseek-v3:671b-q4_K_M - Ollama 框架

deepseek-v3

一個強大的混合專家 (MoE) 語言模型，總共有 671B 個參數，每次 token 啟用 37B 個參數。

671b

749.1K 提取次數更新於 8 週前

更新於 8 週前

8 週前

5da0e2d4a9e0 · 404GB

架構deepseek2

{ "stop": [ "<｜begin of sentence｜>", "<｜end of sentence｜>",

{{- range $i, $_ := .Messages }} {{- if eq .Role "user" }}<｜User｜> {{- else if eq .Role "assista

DEEPSEEK 許可協議 1.0 版本，2023 年 10 月 23 日版權 (c) 2023 DeepSeek 第一節：PR

Readme

注意：此模型需要 Ollama 0.5.5 或更高版本。

DeepSeek-V3 在推理速度上比以前的模型取得了顯著的突破。它在開源模型中名列前茅，並與全球最先進的閉源模型相匹敵。

參考文獻