更新時間 14 個月前
14 個月前
c895ed448eb0 · 29GB
模型
架構llama
·
參數67.4B
·
量化Q3_K_S
29GB
參數
{ "num_ctx": 4096 }
17B
模板
{{ .System }} User: {{ .Prompt }} Assistant:
45B
Readme
DeepSeek LLM 是一個先進的語言模型,提供 70 億和 670 億參數兩種版本。同時提供 chat 和 base 兩種變體。
優越的通用能力:DeepSeek LLM 67B Base 在推理、編碼、數學和中文理解等領域優於 Llama2 70B Base。
精通編碼和數學:DeepSeek LLM 67B Chat 在編碼(使用 HumanEval 基準測試)和數學(使用 GSM8K 基準測試)方面表現出色。