StarCoder2 是新一代透明化訓練的開放原始碼 LLM,共有 3B、7B 和 15B 三種參數規模。
3b 7b 15b
831.8K 下載次數 更新於 5 個月前
更新於 5 個月前
5 個月前
de006f564c13 · 5.1GB
模型
架構starcoder2
·
參數7.17B
·
量化Q5_K_M
5.1GB
參數
{ "stop": [ "<file_sep>", "<|end_of_text|>" ] }
41B
模板
<file_sep> {{- if .Suffix }}<fim_prefix> {{ .Prompt }}<fim_suffix>{{ .Suffix }}<fim_middle> {{- else
142B
許可證
BigCode Open RAIL-M v1 許可協議 第一節:前言 本 OpenRAIL-M 許可協議是
13kB
說明文件
StarCoder2 支援高達 16,384 個 tokens 的上下文窗口,是新一代透明化訓練的開放原始碼 LLM。
starcoder2:instruct
:一個 15B 模型,可以遵循自然語言和人類撰寫的指令starcoder2:15b
使用 600 多種程式語言和 4 兆以上的 tokens 進行訓練。starcoder2:7b
使用 17 種程式語言和 3.5 兆以上的 tokens 進行訓練。starcoder2:3b
使用 17 種程式語言和 3 兆以上的 tokens 進行訓練。
StarCoder2-15B 在同等規模的模型中表現最佳,並且在許多評估中與 33B+ 模型相媲美。StarCoder2-3B 的效能與 StarCoder1-15B 相當。