Qwen2 是阿里巴巴集團推出的一系列新型大型語言模型

工具 0.5b 1.5b 7b 72b

4.1M 6 個月前

自述檔案

Qwen2 使用 29 種語言的資料進行訓練,包括英文和中文

它提供 4 種參數尺寸:0.5B1.5B7B72B

在 7B 和 72B 模型中,上下文長度已擴展至 128k 個 tokens

模型 Qwen2-0.5B Qwen2-1.5B Qwen2-7B Qwen2-72B
參數 0.49B 1.54B 7.07B 72.71B
非嵌入參數 0.35B 1.31B 5.98B 70.21B
GQA
綁定嵌入
上下文長度 32K 32K 128K 128K

支援的語言

除了英文和中文之外,還支援以下語言

地區 語言
西歐 德文、法文、西班牙文、葡萄牙文、義大利文、荷蘭文
東歐與中歐 俄文、捷克文、波蘭文
中東 阿拉伯文、波斯文、希伯來文、土耳其文
東亞 日文、韓文
東南亞 越南文、泰文、印尼文、馬來文、寮文、緬甸文、宿霧語、高棉語、他加祿語
南亞 印地文、孟加拉文、烏爾都文

效能

image.png

image.png

image.png

image.png

許可證

除 Qwen2 72B(指示模型和基礎模型)之外的所有模型均採用 Apache 2.0 許可證。

Qwen2 72B 模型仍使用原始的 Qianwen 許可證。