一個先進的語言模型,以 2 兆雙語 tokens 打造。

7b 67b

132.1K 15 個月前

說明

DeepSeek LLM 是一個先進的語言模型,提供 70 億和 670 億參數兩種版本。提供 chatbase 兩種變體。

  • 卓越的通用能力:DeepSeek LLM 67B Base 在效能上優於 Llama2 70B Base,在推理、編碼、數學和中文理解等領域。

  • 精通編碼與數學:DeepSeek LLM 67B Chat 在效能上表現出色,在編碼(使用 HumanEval 基準測試)和數學(使用 GSM8K 基準測試)方面。

參考

GitHub

HuggingFace