Groq 提供的一系列模型,代表了在工具使用/函數呼叫方面,開源 AI 功能的重大進展。

工具 8b 70b

56.2K 7 個月前

Readme

這些模型是由與 Glaive 合作開發,代表了在工具使用/函數呼叫方面,開源 AI 功能的重大進展。

基準測試結果

這些模型取得了卓越的成果,為具有工具使用功能的大型語言模型設定了新的基準。

  • Llama-3-Groq-70B-Tool-Use:整體準確度 90.76%(在發布時於 BFCL 上排名第一 - 2024 年 7 月)
  • Llama-3-Groq-8B-Tool-Use:整體準確度 89.06%(在發布時於 BFCL 上排名第三 - 2024 年 7 月)

參考資料

Hugging Face

部落格