Qwen2.5 模型是在阿里巴巴最新的大規模資料集上預訓練的,資料集包含高達 18 兆個 tokens。此模型支援高達 128K 個 tokens,並具有多語言支援。
工具 0.5b 1.5b 3b 7b 14b 32b 72b
3.6M 下載次數 更新於 4 個月前
4 個月前更新
4 個月前
b0936ea364bf · 23GB
模型
架構qwen2
·
參數32.8B
·
量化Q5_K_M
23GB
系統
You are Qwen, created by Alibaba Cloud. You are a helpful assistant.
68B
範本
{{- if .Messages }} {{- if or .System .Tools }}<|im_start|>system {{- if .System }} {{ .System }} {{
1.5kB
授權
Apache License Version 2.0, January 200
11kB
說明文件
Qwen2.5 是最新的 Qwen 大型語言模型系列。Qwen2.5 發布了一系列基礎語言模型和指令微調模型,模型大小從 0.5 億到 720 億參數不等。相較於 Qwen2,Qwen2.5 引入了以下改進:
- 它擁有顯著更多的知識,並且由於在這些領域中使用了專業的專家模型,因此在程式碼編寫和數學方面的能力大大增強。
- 它在指令遵循、長文本生成(超過 8K 個 tokens)、理解結構化資料(例如,表格)以及生成結構化輸出,尤其是在 JSON 格式方面展現了顯著的進步。它對於多樣化的系統提示也更具彈性,從而改進了聊天機器人的角色扮演和條件設定。
- 它支援高達 128K 個 tokens 的長上下文,並且可以生成高達 8K 個 tokens。
- 它提供超過 29 種語言的多語言支援,包括中文、英文、法文、西班牙文、葡萄牙文、德文、義大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等等。
請注意:除了 3B 和 72B 模型之外,所有模型均在 Apache 2.0 授權下發布,而 3B 和 72B 模型則在 Qwen 授權下發布。