一系列來自 Groq 的模型,代表著在開源 AI 工具使用/函數呼叫能力方面的重大進展。

工具 8b 70b

56.2K 7 個月前

讀我檔案

這些模型與 Glaive 合作開發,代表著在開源 AI 工具使用/函數呼叫能力方面的重大進展。

基準測試結果

這些模型取得了卓越的成果,為具備工具使用能力的大型語言模型設定了新的基準。

  • Llama-3-Groq-70B-Tool-Use:整體準確度 90.76%(發布時在 BFCL 上排名第一 - 2024 年 7 月)
  • Llama-3-Groq-8B-Tool-Use:整體準確度 89.06%(發布時在 BFCL 上排名第三 - 2024 年 7 月)

參考文獻

Hugging Face

部落格