Meta 的 Llama 3.2 以 1B 和 3B 模型縮小規模。

工具 1b 3b

8.1M 4 個月前

自述檔案

Meta Llama 3.2 多語大型語言模型 (LLM) 系列,是 1B 和 3B 大小的預訓練和指令微調生成模型集合(文字輸入/文字輸出)。Llama 3.2 指令微調的純文字模型,針對多語對話使用案例進行了最佳化,包括代理式檢索和摘要任務。它們在常見的產業基準測試中,勝過許多可用的開放原始碼和封閉式聊天模型。

尺寸

3B 參數(預設)

3B 模型在以下任務上的效能,優於 Gemma 2 2.6B 和 Phi 3.5-mini 模型

  • 遵循指示
  • 摘要
  • 提示詞改寫
  • 工具使用
ollama run llama3.2

1B 參數

1B 模型可與其他 1-3B 參數模型競爭。其使用案例包括

  • 個人資訊管理
  • 多語知識檢索
  • 在邊緣裝置本機端執行改寫任務
ollama run llama3.2:1b

基準測試

Llama 3.2 instruction-tuned benchmarks

支援語言: 官方支援英文、德文、法文、義大利文、葡萄牙文、印地文、西班牙文和泰文。Llama 3.2 的訓練語言範圍,比這 8 種支援語言更廣泛。