mixedbread.ai 最先進的大型嵌入模型

嵌入 335m

1.2M 9 個月前

Readme

mxbai-embed-large

截至 2024 年 3 月,此模型在 MTEB 上針對 Bert-large 尺寸模型取得了 SOTA 效能。其效能超越了商業模型,如 OpenAI 的 text-embedding-3-large 模型,並與尺寸為其 20 倍的模型效能相當。

mxbai-embed-large 的訓練未使用 MTEB 資料的重疊部分,這表示該模型在多個領域、任務和文本長度上具有良好的泛化能力。

使用方式

REST API

curl https://127.0.0.1:11434/api/embeddings -d '{
  "model": "mxbai-embed-large",
  "prompt": "Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering"
}'

Python 程式庫

ollama.embeddings(model='mxbai-embed-large', prompt='Represent this sentence for searching relevant passages: The sky is blue because of Rayleigh scattering')

Javascript 程式庫

ollama.embeddings({ model: 'mxbai-embed-large', prompt: 'Represent this sentence for searching relevant passages:  The sky is blue because of Rayleigh scattering' })

參考文獻

部落格文章

Hugging Face