更新於 2 個月前
2 個月前
d14346ed7d55 · 47GB
模型
archqwen2
·
parameters72.7B
·
quantizationQ4_K_M
47GB
系統
You are Qwen, created by Alibaba Cloud. You are a helpful assistant.
68B
模板
{{- if .Messages }} {{- if or .System .Tools }}<|im_start|>system {{- if .System }} {{ .System }} {{
1.5kB
授權條款
Nexusflow.ai 個人使用授權條款 發布日期:08/19/2024 「協議」指這些條款
6.8kB
Readme
Athene-V2
Nexusflow 的 Athene-V2 聊天模型,基於 Qwen 2.5 的 72B 基礎模型構建,在關鍵基準測試中達到 GPT-4o 等級的效能,同時展示了目標優化如何增強超越傳統擴展方法的特定能力。
模型特色
- 基於 Qwen 2.5 微調的 72B 參數
- 達到或超越 GPT-4o 的頂尖聊天效能
- 優異的程式碼完成能力 (在 bigcode-bench-hard 上排名第二)
- 增強的數學能力 (MATH 基準測試)
- 精確的長篇日誌提取
- 推動 Pareto 前沿的先進後訓練流程