說明文件
Sailor2 是一個社群驅動的倡議,旨在將尖端的多語言語言模型帶到東南亞 (SEA)。我們的研究強調,業界對於8B 和 20B 參數範圍的模型以及用於特殊應用(如推測性解碼和研究目的)的 1B 模型有強烈需求。這些模型以 Apache 2.0 授權發布,提高了整個區域對先進語言技術的可近性。
Sailor2 以出色的多語言模型 Qwen 2.5 為基礎構建,並在 500B 個 tokens 上持續預訓練,以使用統一模型更好地支援 15 種語言。這些語言包括英語、中文、緬甸語、宿霧語、伊洛卡諾語、印尼語、爪哇語、高棉語、寮語、馬來語、巽他語、他加祿語、泰語、越南語和瓦雷語。透過滿足對多樣化、穩健且易於存取的語言模型不斷增長的需求,Sailor2 旨在透過開放、包容和易於存取的多語言 LLM 為東南亞地區服務不足的群體提供服務。Sailor2 模型有 1B、8B 和 20B 三種尺寸,它們分別從 Qwen2.5 的 0.5B、7B 和 14B 基礎模型擴展而來。