Sailor2 是為東南亞設計的多語言模型。提供 1B、8B 和 20B 參數尺寸。

1b 8b 20b

9,799 3 個月前

說明

logo

Sailor2 是一個社群驅動的計畫,旨在為東南亞(SEA)帶來最先進的多語言模型。我們的研究強調,市場對生產環境使用的 8B 和 20B 參數範圍模型以及用於推測解碼和研究目的等特殊應用程式的 1B 模型有強烈需求。這些模型以 Apache 2.0 授權發布,在整個地區提供更強大的進階語言技術可近性。

Sailor2 以優異的多語言模型 Qwen 2.5 為基礎,並在 500B tokens 上持續預訓練,以更完善地支援 15 種語言的統一模型。這些語言包括英語、中文、緬甸語、宿霧語、伊洛卡諾語、印尼語、爪哇語、高棉語、寮語、馬來語、巽他語、他加祿語、泰語、越南語和瓦瑞語。透過滿足對多元、穩健且易於存取的語言模型日益增長的需求,Sailor2 致力於以開放、包容和易於存取的多語言 LLM 為東南亞地區服務不足的族群提供服務。Sailor2 模型有 1B、8B 和 20B 三種尺寸,分別從 Qwen2.5 的 0.5B、7B 和 14B 基礎模型擴展而來。