StarCoder2 是下一代透明化訓練的開放程式碼 LLM,共有三種尺寸:3B、7B 和 15B 參數。

3b 7b 15b

831.8K 5 個月前

Readme

StarCode 2

StarCoder2 支援高達 16,384 個 tokens 的上下文窗口,是下一代透明化訓練的開放程式碼 LLM。

  • starcoder2:instruct:一個 15B 模型,可以遵循自然語言和人類編寫的指令
  • starcoder2:15b 在 600 多種程式語言和 4+ 兆個 tokens 上進行了訓練。
  • starcoder2:7b 在 17 種程式語言和 3.5+ 兆個 tokens 上進行了訓練。
  • starcoder2:3b 在 17 種程式語言和 3+ 兆個 tokens 上進行了訓練。

StarCoder2-15B 在同尺寸級別中表現最佳,並在許多評估中與 33B+ 模型相媲美。StarCoder2-3B 的效能與 StarCoder1-15B 相符。

參考文獻