Granite-3.2 是 IBM Granite 系列的長上下文 AI 模型,針對思考能力進行了微調。

工具 2b 8b

1.7萬 2 週前

說明文件

Granite-3.2 是一系列長上下文 AI 模型,針對思考能力進行了微調。它建立在 Granite-3.1 之上,並使用許可開放原始碼資料集和內部產生的合成資料進行訓練,這些資料專為推理任務而設計。這些模型可以控制其思考能力,確保僅在需要時才應用。

  • 開發者: Granite 團隊,IBM
  • 網站Granite 文件
  • 發布日期: 2025 年 2 月 26 日
  • 授權條款: Apache 2.0

尺寸

這些模型提供兩種參數尺寸:2B 和 8B

ollama run granite3.2:2b
ollama run granite3.2:8b

支援語言: 英語、德語、西班牙語、法語、日語、葡萄牙語、阿拉伯語、捷克語、義大利語、韓語、荷蘭語和中文。但是,使用者可以針對這 12 種語言以外的語言對此 Granite 模型進行微調。

預期用途: 這些模型旨在處理通用指令遵循任務,並且可以整合到各個領域的 AI 助理中,包括商業應用。

功能

  • 思考
  • 摘要
  • 文本分類
  • 文本提取
  • 問答
  • 檢索增強生成 (RAG)
  • 程式碼相關任務
  • 函數調用任務
  • 多語言對話用例
  • 長上下文任務,包括長文檔/會議摘要、長文檔問答等。

思考

若要啟用思考功能,請新增一則訊息,其中 "role": "control",並將 "content" 設定為 "thinking"。例如

{
    "messages": [
        {"role": "control", "content": "thinking"},
        {"role": "user", "content": "How do I get to the airport if my car won't start?"}
    ]
}

參考文獻

網站