CodeQwen1.5 是一個基於大量程式碼資料預訓練的大型語言模型。

7b

133.3K 8 個月前

說明文件

CodeQwen1.5 是基於 Qwen1.5。它使用 3 兆個 tokens 的程式碼資料進行訓練。其主要功能包括

  • 強大的程式碼生成能力,以及在一系列基準測試中具有競爭力的效能
  • 支援長上下文理解和生成,最大上下文長度為 64K tokens
  • 支援 92 種程式語言
  • 在 Text-to-SQL、修復錯誤和其他程式碼使用案例中表現出色。

參考資料

部落格文章

GitHub

HuggingFace