一個精巧而強大的 10.7B 大型語言模型,專為單輪對話設計。

10.7b

76.2K 13 個月前

讀我檔案

Solar 是第一個開源的 107 億參數語言模型。它精巧而功能強大,並在參數少於 30B 的模型中展示了最先進的性能。

此模型利用 Llama 2 架構並採用深度向上擴展技術,將 Mistral 7B 權重整合到向上擴展層中。

在 H6 基準測試中,此模型的性能優於參數高達 30B 的模型,甚至包括 Mixtral 8X7B 模型。

參考文獻

HuggingFace

Upstage AI