說明文件
Solar 是第一個開源的 107 億參數語言模型。它精巧而功能非常強大,並在參數少於 30B 的模型中展現了最先進的效能。
此模型利用 Llama 2 架構並採用 Depth Up-Scaling 技術,將 Mistral 7B 權重整合到升級層中。
在 H6 基準測試中,此模型優於參數高達 30B 的模型,甚至超越 Mixtral 8X7B 模型。
Solar 是第一個開源的 107 億參數語言模型。它精巧而功能非常強大,並在參數少於 30B 的模型中展現了最先進的效能。
此模型利用 Llama 2 架構並採用 Depth Up-Scaling 技術,將 Mistral 7B 權重整合到升級層中。
在 H6 基準測試中,此模型優於參數高達 30B 的模型,甚至超越 Mixtral 8X7B 模型。