OLMo 2 是一個全新的 7B 和 13B 模型系列,最多使用 5T tokens 進行訓練。這些模型在英文學術基準測試中,與同等大小的完全開放模型性能相當或更佳,並且與 Llama 3.1 等開放權重模型相比也具有競爭力。

7b 13b

354K 8 週前

讀我檔案

注意:此模型需要 Ollama 0.5.5

1732650119-wide-4x.webp

OLMo 2 是一個全新的 7B 和 13B 模型系列,最多使用 5T tokens 進行訓練。這些模型在英文學術基準測試中,與同等大小的完全開放模型性能相當或更佳,並且與 Llama 3.1 等開放權重模型相比也具有競爭力。

參考資料

部落格文章