Stable LM 2 是一個最先進的 1.6B 和 12B 參數語言模型,使用包含英文、西班牙文、德文、義大利文、法文、葡萄牙文和荷蘭文的多語言資料進行訓練。

1.6b 12b

105.1K 9 個月前

說明文件

Stable LM 2 1.6B 是一個最先進的 1.6 和 12B 參數小型語言模型,使用包含英文、西班牙文、德文、義大利文、法文、葡萄牙文和荷蘭文的多語言資料進行訓練。

該模型基於公開可用的資料集和合成資料集混合訓練而成,並採用直接偏好優化 (DPO)。

參考文獻

公告

HuggingFace