Cohere R 系列中最小的模型,在通用 GPU 和邊緣設備上提供頂級的速度、效率和品質,以構建強大的 AI 應用程式。

工具 7b

1.37 萬 2 週前

Readme

注意:此模型需要 Ollama 0.5.5

r7b.jpg

C4AI Command R7B 是一個開放權重的研究版本,為一個 70 億參數模型,具有先進功能,針對多種使用案例進行了優化,包括推理、摘要、問答和程式碼。這個模型經過訓練,可以執行複雜的任務,包括檢索增強生成 (RAG) 和工具使用。這個模型還具有強大的代理能力,能夠使用和組合多個工具,通過多個步驟來完成更困難的任務。它在企業相關的程式碼使用案例中獲得了頂級效能。C4AI Command R7B 是一個多語言模型,在 23 種語言上進行了訓練。

模型詳細資訊

模型架構: 這是一個自迴歸語言模型,使用優化的 Transformer 架構。在預訓練之後,這個模型使用監督式微調 (SFT) 和偏好訓練,使模型行為與人類對有幫助和安全的偏好保持一致。這個模型具有三層滑動窗口注意力機制(窗口大小 4096)和 ROPE,用於高效的本地上下文建模和相對位置編碼。第四層使用全局注意力機制,沒有位置嵌入,從而實現了整個序列中不受限制的 token 交互。

涵蓋的語言: 此模型已在 23 種語言上進行訓練:英語、法語、西班牙語、義大利語、德語、葡萄牙語、日語、韓語、阿拉伯語、中文、俄語、波蘭語、土耳其語、越南語、荷蘭語、捷克語、印尼語、烏克蘭語、羅馬尼亞語、希臘語、印地語、希伯來語和波斯語。