Readme
OpenChat 是一系列開源語言模型,使用 C-RLFT 進行微調:這是一種受到離線強化學習啟發的策略。
已更新至 OpenChat-3.5-1210,此模型的新版本在程式碼編寫任務中表現出色,並在許多開源 LLM 基準測試中獲得非常高的分數。
OpenChat 是一系列開源語言模型,使用 C-RLFT 進行微調:這是一種受到離線強化學習啟發的策略。
已更新至 OpenChat-3.5-1210,此模型的新版本在程式碼編寫任務中表現出色,並在許多開源 LLM 基準測試中獲得非常高的分數。