Firefunction-v2 是一個基於 Llama 3 的開放權重函數呼叫模型,其函數呼叫能力可與 GPT-4o 匹敵。

工具 70b

17.9K 6 個月前

讀我

Firefunction-v2 的函數呼叫能力可與 GPT-4o 匹敵,在混合公開基準測試中得分 0.81,GPT-4o 則為 0.80。

Firefunction-v2 針對真實世界情境進行了最佳化,包括多輪對話、指令遵循和並行函數呼叫。它保留了 Llama 3 的多輪指令能力(在 MT bench 上為 0.84 vs 0.89),同時在函數呼叫任務上持續優於 Llama 3(在 Nexus 並行多函數評估中為 0.51 vs 0.30)。

參考資料

部落格文章

Hugging Face