一個高效能模型,使用名為「反思調校」(Reflection-tuning) 的新技術訓練而成,此技術教導 LLM 偵測其推理中的錯誤並修正方向。

70b

102.1K 4 個月前

17 個標籤
5084e77c1e10 • 40GB • 4 個月前
5084e77c1e10 • 40GB • 4 個月前
e04ae4d96458 • 141GB • 4 個月前
8fe3c853372c • 26GB • 4 個月前
9c6705916e06 • 37GB • 4 個月前
a6b22bd90923 • 34GB • 4 個月前
21f651100031 • 31GB • 4 個月前
5084e77c1e10 • 40GB • 4 個月前
b72afde19a06 • 44GB • 4 個月前
be39ad6154f4 • 43GB • 4 個月前
420791ca0c2a • 40GB • 4 個月前
99e430b53c8b • 49GB • 4 個月前
41bd1db0b708 • 53GB • 4 個月前
f537d644476a • 50GB • 4 個月前
84a4d89b332c • 49GB • 4 個月前
77fecce26024 • 58GB • 4 個月前
159e9e593c44 • 75GB • 4 個月前