Qwen2.5 模型在阿里巴巴最新的大規模數據集上進行預訓練,數據集包含多達 18 兆個 tokens。該模型最多支持 128K tokens,並具有多語言支持。
工具 0.5b 1.5b 3b 7b 14b 32b 72b
3.6M 下載次數 更新於 4 個月前
更新於 4 個月前
4 個月前
f8d588c5572a · 1.7GB
模型
架構qwen2
·
參數3.09B
·
量化Q3_K_L
1.7GB
系統
你是 Qwen,由阿里巴巴雲端創建。你是一個有用的助手。
68B
範本
{{- if .Messages }} {{- if or .System .Tools }}<|im_start|>system {{- if .System }} {{ .System }} {{
1.5kB
許可證
Qwen RESEARCH LICENSE AGREEMENT Qwen RESEARCH LICENSE AGREEMENT Release Date: September 19, 2024 B
7.4kB
自述檔案
Qwen2.5 是 Qwen 大型語言模型的最新系列。對於 Qwen2.5,發布了一系列基礎語言模型和指令調整模型,尺寸範圍從 0.5 到 720 億參數。Qwen2.5 引入了相較於 Qwen2 的以下改進之處
- 由於這些領域的專業模型,它擁有顯著更多的知識,並且在編碼和數學方面的能力大大增強。
- 它在指令遵循、長文本生成(超過 8K tokens)、理解結構化數據(例如,表格)和生成結構化輸出方面取得了顯著進展,尤其是在 JSON 格式方面。 它也更能適應多樣化的系統提示,從而改善聊天機器人的角色扮演和條件設定。
- 它支持高達 128K tokens 的長上下文,並且可以生成高達 8K tokens。
- 它為超過 29 種語言提供多語言支持,包括中文、英文、法語、西班牙語、葡萄牙語、德語、意大利語、俄語、日語、韓語、越南語、泰語、阿拉伯語等等。
請注意:除了 3B 和 72B 模型之外的所有模型均以 Apache 2.0 許可證發布,而 3B 和 72B 模型則以 Qwen 許可證發布。