更新於 14 個月前
14 個月前
bc8345b3132d · 4.0GB
model
archllama
·
parameters6.91B
·
quantizationQ4_K_S
4.0GB
params
{ "num_ctx": 4096 }
17B
template
{{ .System }} User: {{ .Prompt }} Assistant:
45B
Readme
DeepSeek LLM 是一個先進的語言模型,有 7b 及 67b 兩種參數規模的版本。同時也提供 chat 及 base 兩種變體。
卓越的通用能力:DeepSeek LLM 67B Base 在推理、編碼、數學和中文理解等領域,性能超越 Llama2 70B Base。
精通編碼與數學:DeepSeek LLM 67B Chat 在編碼(使用 HumanEval 基準測試)和數學(使用 GSM8K 基準測試)方面表現出色。