Stable LM 2 是一個最先進的 1.6B 和 12B 參數語言模型,使用包含英文、西班牙文、德文、義大利文、法文、葡萄牙文和荷蘭文的多語言資料進行訓練。

1.6b 12b

105.1K 9 months ago

Readme

Stable LM 2 1.6B 是一個最先進的 1.6 和 120 億參數小型語言模型,使用包含英文、西班牙文、德文、義大利文、法文、葡萄牙文和荷蘭文的多語言資料進行訓練。

此模型是在公開可用的資料集和合成資料集的混合資料上訓練的,並採用直接偏好最佳化 (DPO)。

參考文獻

公告

HuggingFace