更新於 15 個月前
15 個月前
54fcea7dbb8c · 38GB
模型
archllama
·
parameters67.4B
·
quantizationQ4_K_S
38GB
參數
{ "num_ctx": 4096 }
17B
讀我
DeepSeek LLM 是一款進階語言模型,提供 70 億與 670 億參數兩種版本。同時提供 chat
與 base
兩種變體。
卓越的通用能力:DeepSeek LLM 67B Base 在推理、程式碼、數學和中文理解等領域,效能超越 Llama2 70B Base。
精通程式碼與數學:DeepSeek LLM 67B Chat 在程式碼(使用 HumanEval 基準測試)和數學(使用 GSM8K 基準測試)方面表現出色。