13.67 萬次 下載 更新於 13 個月前
更新於 13 個月前
13 個月前
40a9b8bdcd51 · 3.1GB
OpenChat 是一系列開源語言模型,使用 C-RLFT 進行微調:一種靈感來自離線強化學習的策略。
已更新至 OpenChat-3.5-1210,此新版本的模型在編碼任務方面表現出色,並在許多開源 LLM 基準測試中獲得非常高的分數。
GitHub
HuggingFace