Meta 的 Llama 3.2 推出 1B 和 3B 小型模型。

工具 1b 3b

8.1M 4 個月前

Readme

Meta Llama 3.2 多語言大型語言模型 (LLM) 系列是一系列預訓練和指令微調的生成模型,尺寸包括 1B 和 3B(文字輸入/文字輸出)。Llama 3.2 指令微調的純文字模型針對多語言對話使用案例進行了最佳化,包括代理式檢索和摘要任務。它們在常見的行業基準測試中,性能優於許多現有的開源和閉源聊天模型。

尺寸

3B 參數 (預設)

3B 模型在性能上優於 Gemma 2 2.6B 和 Phi 3.5-mini 模型,適用於以下任務:

  • 遵循指令
  • 摘要
  • 提示重寫
  • 工具使用
ollama run llama3.2

1B 參數

1B 模型與其他 1-3B 參數模型相比具有競爭力。其使用案例包括:

  • 個人資訊管理
  • 多語言知識檢索
  • 邊緣端本地執行的重寫任務
ollama run llama3.2:1b

基準測試

Llama 3.2 instruction-tuned benchmarks

支援語言: 官方支援英語、德語、法語、義大利語、葡萄牙語、印地語、西班牙語和泰語。Llama 3.2 的訓練語言範圍比這 8 種支援語言更廣泛。