一系列基於廣泛數據訓練的開源模型,在多項基準測試中超越 ChatGPT。已更新至 3.5-0106 版本。

7b

136.7K 13 個月前

Readme

OpenChat 是一系列開源語言模型,使用 C-RLFT 進行微調:這是一種靈感來自離線強化學習的策略。

已更新至 OpenChat-3.5-1210,這個新版本的模型在程式碼編寫任務中表現出色,並在許多開源 LLM 基準測試中獲得非常高的分數。

參考文獻

GitHub

HuggingFace