CodeQwen1.5 是一個大型語言模型,以大量的程式碼資料進行預訓練。

7b

133.3K 8 個月前

Readme

CodeQwen1.5 基於 Qwen1.5。它使用 3 兆個 token 的程式碼資料進行訓練。其主要功能包括

  • 強大的程式碼生成能力和在一系列基準測試中具有競爭力的效能
  • 支援長上下文理解和生成,最大上下文長度為 64K 個 token
  • 支援 92 種程式語言
  • 在 Text-to-SQL、錯誤修復和其他程式碼使用案例中表現出色。

參考文獻

部落格文章

GitHub

HuggingFace