一個開源的混合專家程式碼語言模型,其效能在程式碼特定任務中可媲美 GPT4-Turbo。

16b 236b

536.5K 5 個月前

讀我檔案

DeepSeek-Coder-V2 是一個開源的混合專家 (MoE) 程式碼語言模型,其效能在程式碼特定任務中可媲美 GPT4-Turbo。DeepSeek-Coder-V2 是從 DeepSeek-Coder-V2-Base 進一步預訓練而來,使用了來自高品質且多來源語料庫的 6 兆 tokens。

參考文獻

Hugging Face