一個精巧但功能強大的 107 億參數大型語言模型,專為單輪對話而設計。

10.7b

32 個標籤

15 個月前

4077d1b80ff9 · 21GB

說明文件

Solar 是第一個開源的 107 億參數語言模型。它結構精巧,功能卻非常強大,並在參數少於 300 億的模型中展現了最先進的效能。

此模型採用 Llama 2 架構,並採用 Depth Up-Scaling 技術,將 Mistral 7B 權重整合到升級後的層中。

在 H6 基準測試中,此模型的效能優於參數高達 300 億的模型,甚至超越 Mixtral 8X7B 模型。

參考資料

HuggingFace

Upstage AI