deepseek-llm:67b-base-q4_1 - Ollama 框架

deepseek-llm

一款使用 2 兆雙語 tokens 打造的先進語言模型。

7b 67b

132.1K Pulls 更新於 15 個月前

更新於 15 個月前

15 個月前

edfd62087900 · 42GB

{ "num_ctx": 4096 }

Readme

DeepSeek LLM 是一款先進的語言模型，提供 70 億和 670 億參數兩種版本。同時提供 chat 和 base 兩種變體。

卓越的通用能力：DeepSeek LLM 67B Base 在推理、程式碼編寫、數學和中文理解等領域的效能優於 Llama2 70B Base。
精通程式碼編寫和數學：DeepSeek LLM 67B Chat 在程式碼編寫（使用 HumanEval 基準測試）和數學（使用 GSM8K 基準測試）方面表現出色。

參考文獻