Snowflake 的一套文字嵌入模型,針對效能進行了最佳化。

embedding 22m 33m 110m 137m 335m

604.4K 9 個月前

說明文件

snowflake-arctic-embed 是一套文字嵌入模型,專注於建立針對效能最佳化的高品質檢索模型。

這些模型透過利用現有的開放原始碼文字表示模型(例如 bert-base-uncased)進行訓練,並在多階段管線中訓練,以最佳化其檢索效能。

此模型提供 5 種參數大小。

  • snowflake-arctic-embed:335m (預設)
  • snowflake-arctic-embed:137m
  • snowflake-arctic-embed:110m
  • snowflake-arctic-embed:33m
  • snowflake-arctic-embed:22m

參考資料

部落格文章

HuggingFace