DBRX 是由 Databricks 創建的開放、通用型大型語言模型 (LLM)。

132b

1.84萬 11 個月前

說明文件

DBRX 需要 Ollama 0.1.32 版本

DBRX 是一個基於 Transformer 的僅解碼器大型語言模型 (LLM),它使用下一個詞元預測進行訓練。它採用細粒度混合專家 (MoE) 架構,總共有 1320 億個參數,其中 360 億個參數在任何輸入上都是活躍的。它在 12 兆詞元的文本和程式碼資料上進行了預訓練。

它是一個特別有能力的程式碼模型,在程式設計方面超越了像 CodeLLaMA-70B 這樣的專業模型,並且作為通用型 LLM 也具有優勢。

參考資料

部落格文章

HuggingFace