來自 Groq 的一系列模型,代表著開源 AI 在工具使用/函數呼叫能力方面的顯著進步。

工具 8b 70b

56.2K 7 個月前

說明文件

這些模型由 Glaive 協同開發,代表著開源 AI 在工具使用/函數呼叫能力方面的顯著進步。

基準測試結果

這些模型取得了卓越的成果,為具備工具使用能力的大型語言模型設定了新的基準。

  • Llama-3-Groq-70B-Tool-Use:整體準確度 90.76%(在發布時於 BFCL 上排名第一 - 2024 年 7 月)
  • Llama-3-Groq-8B-Tool-Use:整體準確度 89.06%(在發布時於 BFCL 上排名第三 - 2024 年 7 月)

參考文獻

Hugging Face

部落格