Qwen2 是阿里巴巴集團新推出的大型語言模型系列。
工具 (tools) 0.5b 1.5b 7b 72b
4.1M 下載次數 (Pulls) 更新於 (Updated) 6 個月前
更新於 6 個月前 (Updated 6 months ago)
6 個月前 (6 months ago)
5a83f6b7eca1 · 55GB
模型 (model)
架構 (arch)qwen2
·
參數 (parameters)72.7B
·
量化 (quantization)Q5_1
55GB
系統 (system)
您是一位樂於助人的助手。 (You are a helpful assistant.)
28B
參數 (params)
{ "stop": [ "<|im_start|>", "<|im_end|>" ] }
59B
模板 (template)
{{ if .Messages }} {{- if or .System .Tools }}<|im_start|>system {{ .System }} {{- if .Tools }} # T
1.4kB
授權條款 (license)
通義千問授權協議 (Tongyi Qianwen LICENSE AGREEMENT) 通義千問發布日期:2023 年 8 月 3 日 (Tongyi Qianwen Release Date: August 3, 2023) 點擊同意即表示您 (By clicking to agree)
6.9kB
Readme
Qwen2 使用 29 種語言的資料進行訓練,包括英文和中文。
它提供 4 種參數尺寸:0.5B、1.5B、7B、72B。
在 7B 和 72B 模型中,上下文長度已擴展至 128k 個 tokens。
模型 (Models) | Qwen2-0.5B | Qwen2-1.5B | Qwen2-7B | Qwen2-72B |
---|---|---|---|---|
參數 (Params) | 0.49B | 1.54B | 7.07B | 72.71B |
非嵌入參數 (Non-Emb Params) | 0.35B | 1.31B | 5.98B | 70.21B |
GQA | True | True | True | True |
綁定嵌入 (Tie Embedding) | True | True | False | False |
上下文長度 (Context Length) | 32K | 32K | 128K | 128K |
支援語言 (Supported languages)
這是除了英文和中文之外 (This is in addition to English and Chinese)
地區 (Regions) | 語言 (Languages) |
---|---|
西歐 (Western Europe) | 德語、法語、西班牙語、葡萄牙語、義大利語、荷蘭語 (German, French, Spanish, Portuguese, Italian, Dutch) |
東歐與中歐 (Eastern & Central Europe) | 俄語、捷克語、波蘭語 (Russian, Czech, Polish) |
中東 (Middle East) | 阿拉伯語、波斯語、希伯來語、土耳其語 (Arabic, Persian, Hebrew, Turkish) |
東亞 (Eastern Asia) | 日語、韓語 (Japanese, Korean) |
東南亞 (South-Eastern Asia) | 越南語、泰語、印尼語、馬來語、寮語、緬甸語、宿霧語、高棉語、塔加洛語 (Vietnamese, Thai, Indonesian, Malay, Lao, Burmese, Cebuano, Khmer, Tagalog) |
南亞 (Southern Asia) | 印地語、孟加拉語、烏爾都語 (Hindi, Bengali, Urdu) |
效能 (Performance)
授權條款 (License)
除 Qwen2 72B(instruct 和 base 模型)外的所有模型均採用 Apache 2.0 授權條款。(All models with the exception of Qwen2 72B (both instruct and base models) are Apache 2.0 licensed.)
Qwen2 72B 模型仍使用原始的 Qianwen 授權條款。(Qwen2 72B model still uses the original Qianwen License.)