Cohere R 系列中最小的模型,在消費級 GPU 和邊緣設備上提供頂級的速度、效率和品質,以構建強大的 AI 應用程式。
工具 7b
13.7K 下載次數 更新於 2 週前
更新於 2 週前
2 週前
ff4e9696ef9f · 5.1GB
模型
archcohere2
·
parameters8.03B
·
quantizationQ4_K_M
5.1GB
參數
{ "stop": [ "<|START_OF_TURN_TOKEN|>", "<|END_OF_TURN_TOKEN|>", "<|END_R
110B
範本
{{- if or .Tools .System }}<|START_OF_TURN_TOKEN|><|SYSTEM_TOKEN|> {{- if .Tools }}# System Preamble
7.2kB
許可證
Creative Commons Attribution-NonCommercial 4.0 International Public License with Acceptable Use Add
14kB
讀我檔案
注意:此模型需要 Ollama 0.5.5
C4AI Command R7B 是一個開放權重的研究版本,包含一個 70 億參數模型,具有先進的功能,針對各種用例進行了優化,包括推理、摘要、問答和程式碼。 該模型經過訓練,可以執行複雜的任務,包括檢索增強生成(RAG)和工具使用。 該模型還具有強大的代理能力,能夠使用和組合多個工具,通過多個步驟來完成更困難的任務。 它在企業相關的程式碼用例中獲得了頂級效能。 C4AI Command R7B 是一個多語言模型,在 23 種語言上進行了訓練。
模型詳細資訊
模型架構: 這是一個自迴歸語言模型,它使用優化的 Transformer 架構。 在預訓練之後,此模型使用監督微調(SFT)和偏好訓練,以使模型行為與人類對幫助性和安全性的偏好保持一致。 該模型具有三層滑動窗口注意力機制(窗口大小 4096)和 ROPE,用於有效的局部上下文建模和相對位置編碼。 第四層使用全局注意力,沒有位置嵌入,從而可以在整個序列中實現不受限制的 token 交互。
涵蓋語言: 該模型已在 23 種語言上進行訓練:英語、法語、西班牙語、義大利語、德語、葡萄牙語、日語、韓語、阿拉伯語、中文、俄語、波蘭語、土耳其語、越南語、荷蘭語、捷克語、印尼語、烏克蘭語、羅馬尼亞語、希臘語、印地語、希伯來語和波斯語。