一個使用兩兆雙語 tokens 打造的先進語言模型。

7b 67b

132.1K 15 個月前

說明文件

DeepSeek LLM 是一個先進的語言模型,提供 70 億和 670 億參數兩種版本。同時提供 chatbase 兩種變體版本。

  • 卓越的通用能力:DeepSeek LLM 67B Base 在推理、程式碼編寫、數學和中文理解等領域,表現優於 Llama2 70B Base。

  • 精通程式碼編寫和數學:DeepSeek LLM 67B Chat 在程式碼編寫(使用 HumanEval benchmark)和數學(使用 GSM8K benchmark)方面展現出色的效能。

參考資料

GitHub

HuggingFace