一個開源的混合專家 (MoE) 架構程式碼語言模型,在程式碼特定任務中,效能可與 GPT4-Turbo 相媲美。

16b 236b

536.5K 5 個月前

說明文件

DeepSeek-Coder-V2 是一個開源的混合專家 (MoE) 架構程式碼語言模型,在程式碼特定任務中的效能可與 GPT4-Turbo 相媲美。 DeepSeek-Coder-V2 是基於 DeepSeek-Coder-V2-Base 進行再預訓練的模型,使用了來自高品質、多來源語料庫的 6 兆個 tokens。

參考文獻

Hugging Face