Qwen2 是阿里巴巴集團新推出的大型語言模型系列。

tools 0.5b 1.5b 7b 72b

4.1M 4 個月前

Readme

Qwen2 使用 29 種語言的資料進行訓練,包括英文和中文

它提供 4 種參數尺寸:0.5B1.5B7B72B

在 7B 和 72B 模型中,上下文長度已擴展至 128k tokens

Models Qwen2-0.5B Qwen2-1.5B Qwen2-7B Qwen2-72B
Params 0.49B 1.54B 7.07B 72.71B
Non-Emb Params 0.35B 1.31B 5.98B 70.21B
GQA True True True True
Tie Embedding True True False False
Context Length 32K 32K 128K 128K

Supported languages

這是除了英文和中文以外的語言。

Regions Languages
Western Europe 德文、法文、西班牙文、葡萄牙文、義大利文、荷蘭文
Eastern & Central Europe 俄文、捷克文、波蘭文
Middle East 阿拉伯文、波斯文、希伯來文、土耳其文
Eastern Asia 日文、韓文
South-Eastern Asia 越南文、泰文、印尼文、馬來文、寮文、緬甸文、宿霧語、高棉語、塔加拉語
Southern Asia 印地文、孟加拉文、烏爾都文

Performance

image.png

image.png

image.png

image.png

License

除 Qwen2 72B(instruct 和 base 模型)以外的所有模型均採用 Apache 2.0 授權。

Qwen2 72B 模型仍使用原始的 Qianwen 授權。