StarCoder2 是新一代透明化訓練的開放原始碼 LLM,提供 3B、7B 和 15B 三種參數尺寸。

3b 7b 15b

897.7K 6 個月前

自述文件

StarCode 2

StarCoder2 支援高達 16,384 個 token 的上下文窗口,是新一代透明化訓練的開放原始碼 LLM。

  • starcoder2:instruct:一個遵循自然語言和人類撰寫指令的 15B 模型
  • starcoder2:15b 在 600 多種程式語言和 4 兆多個 token 上進行了訓練。
  • starcoder2:7b 在 17 種程式語言和 3.5 兆多個 token 上進行了訓練。
  • starcoder2:3b 在 17 種程式語言和 3 兆多個 token 上進行了訓練。

StarCoder2-15B 在其尺寸級別中表現最佳,並且在許多評估中與 33B+ 模型相匹配。 StarCoder2-3B 的效能與 StarCoder1-15B 相匹配。

參考資料