🪐 一系列小型模型,包含 135M、360M 和 1.7B 等三種參數規模。這些模型使用全新的高品質資料集進行訓練。

135m 360m 1.7b

169K 5 個月前

說明文件

SmolLM 是一系列小型語言模型,包含 135M、360M 和 1.7B 等三種參數規模。

參考資料

部落格文章

Hugging Face