Groq 模型系列,代表著開源 AI 在工具使用/函數呼叫能力方面的重大進展。

工具 8b 70b

56.2K 7 months ago

讀我檔案

這些模型與 Glaive 合作開發,代表著開源 AI 在工具使用/函數呼叫能力方面的重大進展。

基準測試結果

這些模型取得了顯著的成果,為具有工具使用能力的大型語言模型設定了新的基準。

  • Llama-3-Groq-70B-Tool-Use:整體準確度 90.76%(在發布時於 BFCL 上排名第一 - 2024 年 7 月)
  • Llama-3-Groq-8B-Tool-Use:整體準確度 89.06%(在發布時於 BFCL 上排名第三 - 2024 年 7 月)

參考文獻

Hugging Face

部落格