Stable LM 2 是一個最先進的 1.6B 和 12B 參數語言模型,使用包含英文、西班牙文、德文、義大利文、法文、葡萄牙文和荷蘭文的多語數據進行訓練。
1.6b 12b
105.1K 提取次數 更新於 9 個月前
說明文件
Stable LM 2 1.6B 是一個最先進的 1.6 和 12B 十億參數小型語言模型,使用包含英文、西班牙文、德文、義大利文、法文、葡萄牙文和荷蘭文的多語數據進行訓練。
該模型在公開可用的數據集和合成數據集的混合數據上進行訓練,並利用直接偏好優化 (DPO)。