更新於 14 個月前
14 個月前
eb54db87f46b · 48GB
模型
架構llama
·
參數67.4B
·
量化Q5_K_M
48GB
參數
{ "num_ctx": 4096 }
17B
Readme
DeepSeek LLM 是一款先進的語言模型,提供 70 億和 670 億參數兩種版本。chat
和 base
兩種變體版本皆有提供。
卓越的通用能力:DeepSeek LLM 67B Base 在推理、程式碼編寫、數學和中文理解等領域,效能超越 Llama2 70B Base。
精通程式碼編寫與數學:DeepSeek LLM 67B Chat 在程式碼編寫(使用 HumanEval 基準測試)和數學(使用 GSM8K 基準測試)方面展現出色的效能。