自述文件
Granite-3.2 是針對思考能力微調的長脈絡 AI 模型系列。它基於 Granite-3.1 構建,並使用許可開放原始碼資料集和專為推理任務設計的內部生成合成資料的混合進行訓練。這些模型允許對其思考能力進行控制,確保僅在需要時才應用。
- 開發者: Granite 團隊,IBM
- 網站: Granite 文件
- 發布日期: 2025 年 2 月 26 日
- 許可證: Apache 2.0
尺寸
這些模型提供兩種參數尺寸:2B 和 8B
ollama run granite3.2:2b
ollama run granite3.2:8b
支援語言: 英語、德語、西班牙語、法語、日語、葡萄牙語、阿拉伯語、捷克語、義大利語、韓語、荷蘭語和中文。但是,使用者可以針對這 12 種語言以外的語言微調此 Granite 模型。
預期用途: 這些模型旨在處理一般指令遵循任務,並且可以整合到各個領域(包括商業應用)的 AI 助理中。
功能
- 思考
- 摘要
- 文本分類
- 文本提取
- 問答
- 檢索增強生成 (RAG)
- 程式碼相關任務
- 函數呼叫任務
- 多語言對話用例
- 長脈絡任務,包括長文件/會議摘要、長文件問答等。
思考
若要啟用思考功能,請新增一則訊息,其中 "role": "control"
並將 "content"
設定為 "thinking"
。例如
{
"messages": [
{"role": "control", "content": "thinking"},
{"role": "user", "content": "How do I get to the airport if my car won't start?"}
]
}