Groq 出品的一系列模型,代表了在用於工具使用/函數調用的開源 AI 能力方面取得的重大進展。

工具 8b 70b

56.2K 7 個月前

說明

這些模型是與 Glaive 合作開發的,代表了在用於工具使用/函數調用的開源 AI 能力方面取得的重大進展。

基準測試結果

這些模型取得了卓越的成果,為具有工具使用能力的大型語言模型設定了新的基準。

  • Llama-3-Groq-70B-Tool-Use: 90.76% 整體準確度 (發佈時在 BFCL 上排名第一 - 2024 年 7 月)
  • Llama-3-Groq-8B-Tool-Use: 89.06% 整體準確度 (發佈時在 BFCL 上排名第三 - 2024 年 7 月)

參考文獻

Hugging Face

部落格