Sailor2 是為東南亞設計的多語言模型。提供 1B、8B 和 20B 參數尺寸。

1b 8b 20b

9,796 3 個月前

說明文件

logo

Sailor2 是一個社群驅動的倡議,旨在為東南亞 (SEA) 帶來尖端的多語言模型。我們的研究強調,業界對於參數範圍在 8B 和 20B 的模型有強烈需求,同時也需要用於特殊應用(例如推測性解碼和研究目的)的 1B 模型。這些模型以 Apache 2.0 授權發布,旨在提高整個地區對先進語言技術的可及性。

Sailor2 以出色的多語言模型 Qwen 2.5 為基礎,並在 5000 億個 tokens 上持續預訓練,以更好地支持 15 種語言的統一模型。這些語言包括英語、中文、緬甸語、宿霧語、伊洛卡諾語、印尼語、爪哇語、高棉語、寮語、馬來語、巽他語、他加祿語、泰語、越南語和瓦瑞語。通過滿足對多樣化、穩健且易於訪問的語言模型日益增長的需求,Sailor2 致力於為東南亞地區服務不足的地區提供開放、包容且易於訪問的多語言 LLM。Sailor2 模型有三種尺寸:1B、8B 和 20B,它們分別從 Qwen2.5 基礎模型的 0.5B、7B 和 14B 擴展而來。