Snowflake 出品的一系列文字嵌入模型,針對效能進行最佳化。

嵌入 22m 33m 110m 137m 335m

604.3K 9 個月前

自述檔案

snowflake-arctic-embed 是一系列文字嵌入模型,專注於建立針對效能最佳化的高品質檢索模型。

這些模型透過利用現有的開放原始碼文字表示模型(例如 bert-base-uncased)進行訓練,並在多階段管線中進行訓練,以最佳化其檢索效能。

此模型提供 5 種參數大小

  • snowflake-arctic-embed:335m (預設)
  • snowflake-arctic-embed:137m
  • snowflake-arctic-embed:110m
  • snowflake-arctic-embed:33m
  • snowflake-arctic-embed:22m

參考資料

部落格文章

HuggingFace