一個使用 2 兆雙語 tokens 精心打造的進階語言模型。

7b 67b

116.6K 14 個月前

Readme

DeepSeek LLM 是一個進階語言模型,提供 70 億和 670 億參數兩種版本。同時提供 chat 和 base 兩種變體。

  • 卓越的通用能力:DeepSeek LLM 67B Base 在推理、編碼、數學和中文理解等領域優於 Llama2 70B Base。

  • 精通編碼和數學:DeepSeek LLM 67B Chat 在編碼(使用 HumanEval 基準測試)和數學(使用 GSM8K 基準測試)方面表現出色。

參考文獻

GitHub

HuggingFace