已更新 14 個月前
14 個月前
752d030cca1f · 4.8GB
model
archllama
·
parameters6.91B
·
quantizationQ5_K_S
4.8GB
params
{ "num_ctx": 4096 }
17B
說明文件
DeepSeek LLM 是一個先進的語言模型,提供 70 億和 670 億參數兩種版本。同時提供 chat
和 base
兩種變體。
卓越的通用能力:DeepSeek LLM 67B Base 在推理、程式設計、數學和中文理解等領域,性能優於 Llama2 70B Base。
精通程式設計與數學:DeepSeek LLM 67B Chat 在程式設計(使用 HumanEval 基準測試)和數學(使用 GSM8K 基準測試)方面表現出色。