Qwen2 是阿里巴巴集團推出的一系列新型大型語言模型

工具 0.5b 1.5b 7b 72b

4.1M 4 個月前

說明文件

Qwen2 是使用 29 種語言的資料進行訓練,包括英文和中文

它提供 4 種參數尺寸:0.5B1.5B7B72B

在 7B 和 72B 模型中,上下文長度已擴展至 128k 個 tokens

模型 Qwen2-0.5B Qwen2-1.5B Qwen2-7B Qwen2-72B
參數 0.49B 1.54B 7.07B 72.71B
非嵌入參數 0.35B 1.31B 5.98B 70.21B
GQA
綁定嵌入
上下文長度 32K 32K 128K 128K

支援語言

除了英文和中文之外,還支援以下語言

區域 語言
西歐 德文、法文、西班牙文、葡萄牙文、義大利文、荷蘭文
東歐 & 中歐 俄文、捷克文、波蘭文
中東 阿拉伯文、波斯文、希伯來文、土耳其文
東亞 日文、韓文
東南亞 越南文、泰文、印尼文、馬來文、寮文、緬甸文、宿霧語、高棉文、塔加洛語
南亞 印地文、孟加拉文、烏爾都文

效能

image.png

image.png

image.png

image.png

授權條款

除 Qwen2 72B(instruct 和 base 模型)外的所有模型均採用 Apache 2.0 授權條款。

Qwen2 72B 模型仍然使用原始的 Qianwen License。