🪐 一系列小型模型,具有 135M、360M 和 1.7B 參數,並在新的高品質資料集上訓練。

135m 360m 1.7b

169K 5 個月前

Readme

SmolLM 是一系列小型語言模型,提供三種尺寸:135M、360M 和 1.7B 參數。

參考文獻

部落格文章

Hugging Face