OLMo 2 是一個新的 7B 和 13B 模型系列,使用高達 5T tokens 的資料進行訓練。這些模型與同等規模的完全開放模型效能相當或更優,並且在英語學術基準測試中,能與開放權重模型(如 Llama 3.1)競爭。

7b 13b

2.9萬 3 週前

說明文件

注意:此模型需要 Ollama 0.5.5

1732650119-wide-4x.webp

OLMo 2 是一個新的 7B 和 13B 模型系列,使用高達 5T tokens 的資料進行訓練。這些模型與同等規模的完全開放模型效能相當或更優,並且在英語學術基準測試中,能與開放權重模型(如 Llama 3.1)競爭。

參考文獻

部落格文章