CodeQwen1.5 是一個基於大量程式碼資料預訓練的大型語言模型。

7b

133.3K 8 個月前

說明文件

CodeQwen1.5 基於 Qwen1.5。它使用 3 兆個程式碼資料的 token 進行訓練。其主要功能包括:

  • 強大的程式碼生成能力,以及在一系列基準測試中具有競爭力的效能。
  • 支援長上下文理解和生成,最大上下文長度為 64K 個 token。
  • 支援 92 種程式語言。
  • 在 Text-to-SQL、修復錯誤和其他程式碼使用案例中表現出色。

參考資料

部落格文章

GitHub

HuggingFace