一個開源的混合專家模型(MoE)程式碼語言模型,在程式碼相關任務中達到與 GPT4-Turbo 相媲美的效能。

16b 236b

536.5K 5 個月前

讀我檔案

DeepSeek-Coder-V2 是一個開源的混合專家模型(MoE)程式碼語言模型,在程式碼相關任務中達到與 GPT4-Turbo 相媲美的效能。DeepSeek-Coder-V2 基於 DeepSeek-Coder-V2-Base 進一步預訓練而成,使用了來自高品質和多來源語料庫的 6 兆個 tokens。

參考資料

Hugging Face