DeepSeek-V2.5 是 DeepSeek-V2 的升級版本,整合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和程式碼編寫能力。
236b
1.86萬 下載次數 更新於 4 個月前
更新於 4 個月前
4 個月前
409b2dd8a3c4 · 133GB
模型
架構deepseek2
·
參數236B
·
量化Q4_0
133GB
參數
{ "stop": [ "<|begin of sentence|>", "<|end of sentence|>",
241B
範本
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
493B
授權許可
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
讀我檔案
DeepSeek-V2.5 是一個升級版本,結合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct。這個新模型整合了先前兩個版本的通用和程式碼編寫能力。
DeepSeek-V2.5 更符合人類偏好,並在各方面進行了優化,包括寫作和指令遵循
指標 | DeepSeek-V2-0628 | DeepSeek-Coder-V2-0724 | DeepSeek-V2.5 |
---|---|---|---|
AlpacaEval 2.0 | 46.6 | 44.5 | 50.5 |
ArenaHard | 68.3 | 66.3 | 76.2 |
AlignBench | 7.88 | 7.91 | 8.04 |
MT-Bench | 8.85 | 8.91 | 9.02 |
HumanEval python | 84.5 | 87.2 | 89 |
HumanEval Multi | 73.8 | 74.8 | 73.8 |
LiveCodeBench(01-09) | 36.6 | 39.7 | 41.8 |
Aider | 69.9 | 72.9 | 72.2 |
SWE-verified | N/A | 19 | 16.8 |
DS-FIM-Eval | N/A | 73.2 | 78.3 |
DS-Arena-Code | N/A | 49.5 | 63.1 |