Ollama 搜尋 - Ollama 框架

tools 0.5b 1.5b 3b 7b 14b 32b 72b

7.6M 下載次數 68 標籤更新於 9 個月前

qwen2.5

Qwen2.5 模型在阿里巴巴最新的大規模資料集上進行預訓練，包含高達 18 兆個 token。該模型支援高達 128K 個 token，並具有多語言支援。

5.2M 下載次數 133 標籤更新於 5 個月前

qwen2.5-coder

最新的程式碼專用 Qwen 模型系列，在程式碼生成、程式碼推理和程式碼修復方面有顯著改進。

tools 0.5b 1.5b 3b 7b 14b 32b

4.6M 下載次數 196 標籤更新於 4 個月前

qwen

Qwen 1.5 是阿里巴巴雲端推出的一系列大型語言模型，參數規模從 0.5B 到 110B

0.5b 1.8b 4b 7b 14b 32b 72b 110b

4.5M 下載次數 379 標籤更新於 10 個月前

gemma

Gemma 是 Google DeepMind 打造的輕量級、最先進開放模型系列。已更新至 1.1 版本

2b 7b

4.4M 下載次數 102 標籤更新於 11 個月前

qwen2

Qwen2 是阿里巴巴集團推出的新系列大型語言模型

tools 0.5b 1.5b 7b 72b

4.1M 提取次數 97 標籤更新於 6 個月前

llava

🌋 LLaVA 是一個新穎的端到端訓練大型多模態模型，結合了視覺編碼器和 Vicuna，用於通用視覺和語言理解。已更新至 1.6 版本。

視覺 7b 13b 34b

4M 提取次數 98 標籤更新於 13 個月前

gemma2

Google Gemma 2 是一個高效能且有效率的模型，提供三種尺寸：2B、9B 和 27B。

2b 9b 27b

3.4M 提取次數 94 標籤更新於 7 個月前

llama2

Llama 2 是一系列基礎語言模型，參數範圍從 7B 到 70B。

7b 13b 70b

3.1M 提取次數 102 標籤更新於 14 個月前

phi3

Phi-3 是微軟推出的一系列最先進的輕量級開放模型，包含 3B (Mini) 和 14B (Medium) 兩種尺寸。

3.8b 14b

2.9M 提取次數 72 標籤更新於 7 個月前

codellama

一個大型語言模型，可以使用文字提示來產生和討論程式碼。

7b 13b 34b 70b

1.8M 提取次數 199 標籤更新於 7 個月前

mxbai-embed-large

來自 mixedbread.ai 的最先進大型嵌入模型

嵌入 335m

1.8M 提取次數 4 標籤更新於 10 個月前

llama3.2-vision

Llama 3.2 Vision 是一系列指令微調的圖像推理生成模型，具有 11B 和 90B 兩種尺寸。

視覺 11b 90b

1.5M 提取次數 9 標籤更新於 4 個月前

tinyllama

TinyLlama 專案是一個開放的努力，旨在用 3 兆個 tokens 訓練一個精巧的 1.1B Llama 模型。

1.1b

1.3M 提取次數 36 標籤更新於 14 個月前

mistral-nemo

Mistral AI 與 NVIDIA 合作建構的最先進 12B 模型，具有 128k 上下文長度。

工具 12b

1.3M 提取次數 17 標籤更新於 7 個月前

starcoder2

StarCoder2 是下一代透明訓練的開放程式碼 LLM，提供三種尺寸：3B、7B 和 15B 參數。

3b 7b 15b

898K 提取次數 67 標籤更新於 6 個月前

deepseek-v3

一個強大的專家混合 (MoE) 語言模型，總共有 671B 個參數，每個 token 啟用 37B 個參數。

671b

750.1K 提取次數 5 標籤更新於 8 週前

llama2-uncensored

George Sung 和 Jarrad Hope 開發的未經審查 Llama 2 模型。

7b 70b

732.8K 提取次數 34 標籤更新於 16 個月前

deepseek-coder-v2

一個開源的專家混合程式碼語言模型，在程式碼特定任務中實現了與 GPT4-Turbo 相媲美的效能。

16b 236b

723.4K 提取次數 64 標籤更新於 6 個月前

snowflake-arctic-embed

Snowflake 的一系列文字嵌入模型，針對效能進行了最佳化。

嵌入 22m 33m 110m 137m 335m

697.9K 提取次數 16 標籤更新於 11 個月前

deepseek-coder

DeepSeek Coder 是一個功能強大的程式碼模型，使用兩兆個程式碼和自然語言 tokens 進行訓練。

1.3b 6.7b 33b

602.6K 提取次數 102 標籤更新於 14 個月前

mixtral

Mistral AI 開發的一組具有開放權重的專家混合 (MoE) 模型，尺寸為 8x7b 和 8x22b 參數。

工具 8x7b 8x22b

583.5K 提取次數 70 標籤更新於 2 個月前

bge-m3

BGE-M3 是 BAAI 的新型號，以其在多功能性、多語言性和多粒度方面的多樣性而著稱。

嵌入 567m

563.2K 提取次數 3 標籤更新於 7 個月前

minicpm-v

一系列多模態 LLM (MLLM)，專為視覺語言理解而設計。

視覺 8b

547.2K 提取次數 17 標籤更新於 3 個月前

codegemma

CodeGemma 是一系列強大、輕量型的模型，可以執行各種程式碼任務，例如填空中程式碼完成、程式碼生成、自然語言理解、數學推理和指令遵循。

2b 7b

532.1K 下載次數 85 標籤更新於 7 個月前

dolphin-mixtral

無審查，基於 Mixtral 專家混合模型微調的 8x7b 和 8x22b 模型，擅長編碼任務。由 Eric Hartford 創建。

8x7b 8x22b

522.7K 下載次數 70 標籤更新於 2 個月前

openthinker

一個完全開源的推理模型系列，使用從 DeepSeek-R1 提煉出的數據集構建。

7b 32b

510.1K 下載次數 9 標籤更新於 4 週前

phi

Phi-2：微軟研究院的 2.7B 語言模型，展示了出色的推理和語言理解能力。

2.7b

497.3K 下載次數 18 標籤更新於 14 個月前

llava-llama3

一個從 Llama 3 Instruct 微調而來的 LLaVA 模型，在多個基準測試中獲得更好的分數。

視覺 8b

453.7K 下載次數 4 標籤更新於 10 個月前

dolphin3

Dolphin 3.0 Llama 3.1 8B 🐬 是下一代 Dolphin 系列指令微調模型，旨在成為終極通用本地模型，支援編碼、數學、代理、函數呼叫和一般用例。

8b

397.4K 下載次數 5 標籤更新於 2 個月前

smollm2

SmolLM2 是一個緊湊型語言模型系列，提供三種尺寸：135M、360M 和 1.7B 參數。

工具 135m 360m 1.7b

376.4K 下載次數 49 標籤更新於 4 個月前

olmo2

OLMo 2 是一個新的 7B 和 13B 模型系列，使用高達 5T 的 tokens 訓練。這些模型與同等大小的完全開放模型性能相當或更好，並且在英語學術基準測試中與 Llama 3.1 等開放權重模型競爭。

362.9K 下載次數 9 標籤更新於 2 個月前

wizardlm2

來自微軟 AI 的最先進大型語言模型，在複雜的聊天、多語言、推理和代理用例方面具有改進的性能。

7b 8x22b

357.1K 下載次數 22 標籤更新於 11 個月前

dolphin-mistral

基於 Mistral 的無審查 Dolphin 模型，擅長編碼任務。已更新至 2.8 版本。

326.1K 下載次數 120 標籤更新於 11 個月前

all-minilm

非常大的句子級數據集上的嵌入模型。

嵌入 22m 33m

312.2K 下載次數 10 標籤更新於 10 個月前

mistral-small

Mistral Small 3 在 70B 以下的「小型」大型語言模型類別中樹立了新的基準。

工具 22b 24b

303.6K 下載次數 21 標籤更新於 5 週前

dolphin-llama3

Dolphin 2.9 是 Eric Hartford 基於 Llama 3 開發的新模型，具有 8B 和 70B 兩種尺寸，並具備多種指令、對話和編碼技能。

293.9K 下載次數 53 標籤更新於 10 個月前

command-r

Command R 是一個為對話互動和長上下文任務優化的大型語言模型。

工具 35b

283.3K 下載次數 32 標籤更新於 6 個月前

orca-mini

一個通用模型，參數範圍從 30 億到 700 億，適用於入門級硬體。

3b 7b 13b 70b

277.4K 下載次數 119 標籤更新於 16 個月前

yi

Yi 1.5 是一個高性能的雙語語言模型。

6b 9b 34b

267.4K 下載次數 174 標籤更新於 10 個月前

hermes3

Hermes 3 是 Nous Research 旗艦 Hermes 系列 LLM 的最新版本。

工具 3b 8b 70b 405b

265K 下載次數 65 標籤更新於 2 個月前

phi3.5

一個輕量級 AI 模型，具有 38 億參數，性能超越了類似和更大尺寸的模型。

3.8b

250.3K 下載次數 17 標籤更新於 6 個月前

zephyr

Zephyr 是 Mistral 和 Mixtral 模型的一系列微調版本，經過訓練可以作為有用的助手。

7b 141b

238.4K 下載次數 40 標籤更新於 11 個月前

codestral

Codestral 是 Mistral AI 首個專為程式碼生成任務設計的程式碼模型。

22b

228.4K 下載次數 17 標籤已更新 6 個月前

granite-code

IBM 為程式碼智慧開發的開放基礎模型系列

3b 8b 20b 34b

191.8K 下載次數 162 標籤已更新 6 個月前

smollm

🪐 一系列小型模型，參數規模包含 135M、360M 和 1.7B，並以全新的高品質資料集訓練。

135m 360m 1.7b

189.1K 下載次數 94 標籤已更新 6 個月前

starcoder

StarCoder 是一個程式碼生成模型，以 80 多種程式語言進行訓練。

1b 3b 7b 15b

187.8K 下載次數 100 標籤已更新 16 個月前

wizard-vicuna-uncensored

Wizard Vicuna Uncensored 是一個基於 Eric Hartford 的 Llama 2 Uncensored 模型，參數規模包含 7B、13B 和 30B。

7b 13b 30b

186K 下載次數 49 標籤已更新 16 個月前

vicuna

基於 Llama 和 Llama 2 的通用聊天模型，上下文大小為 2K 至 16K。

7b 13b 33b

176.3K 下載次數 111 標籤已更新 16 個月前

mistral-openorca

Mistral OpenOrca 是一個 70 億參數的模型，基於 Mistral 7B 模型，並使用 OpenOrca 資料集進行微調。

167.1K 下載次數 17 標籤已更新 17 個月前

llama2-chinese

基於 Llama 2 的模型，經過微調以提升中文對話能力。

150K 下載次數 35 標籤已更新 16 個月前

openchat

一系列基於多種資料訓練的開源模型，在多項基準測試中超越 ChatGPT。已更新至 3.5-0106 版本。

145.6K 下載次數 50 標籤已更新 14 個月前

codegeex4

一個適用於 AI 軟體開發場景的多功能模型，包含程式碼自動完成功能。

9b

139.3K 下載次數 17 標籤已更新 8 個月前

aya

由 Cohere 發布的 Aya 23 是一個全新的最先進多語言模型系列，支援 23 種語言。

8b 35b

136.5K 下載次數 33 標籤已更新 9 個月前

codeqwen

CodeQwen1.5 是一個大型語言模型，預訓練於大量的程式碼資料。

135K 下載次數 30 標籤已更新 8 個月前

deepseek-llm

一個以 2 兆雙語 tokens 精心打造的先進語言模型。

7b 67b

132.2K 下載次數 64 標籤已更新 15 個月前

deepseek-v2

一個強大、經濟且高效的專家混合語言模型。

16b 236b

128.6K 下載次數 34 標籤已更新 8 個月前

mistral-large

Mistral Large 2 是 Mistral 全新的旗艦模型，在程式碼生成、數學和推理方面能力顯著提升，具有 128k 上下文窗口並支援數十種語言。

工具 123b

125.3K 下載次數 32 標籤已更新 3 個月前

glm4

一個強大的多語言通用語言模型，性能可與 Llama 3 媲美。

9b

123.6K 下載次數 32 標籤已更新 8 個月前

stable-code

Stable Code 3B 是一個程式碼模型，具有指令和程式碼自動完成變體，性能與 Code Llama 7B 等模型相當，但模型規模縮小了 2.5 倍。

3b

122.4K 下載次數 36 標籤已更新 11 個月前

openhermes

OpenHermes 2.5 是一個由 Teknium 在 Mistral 上使用完全開放資料集微調的 7B 模型。

122.1K 下載次數 35 標籤已更新 14 個月前

nous-hermes2

Nous Research 強大的模型系列，擅長科學討論和程式碼編寫任務。

10.7b 34b

121.9K 下載次數 33 標籤已更新 14 個月前

qwen2-math

Qwen2 Math 是一系列基於 Qwen2 LLMs 建構的專業數學語言模型，其數學能力顯著優於開源模型，甚至閉源模型 (例如 GPT4o)。

1.5b 7b 72b

120.7K 下載次數 52 標籤已更新 6 個月前

tinydolphin

一個實驗性的 1.1B 參數模型，由 Eric Hartford 基於 TinyLlama 並使用全新的 Dolphin 2.8 資料集訓練而成。

1.1b

120.6K 下載次數 18 標籤更新於 13 個月前

command-r-plus

Command R+ 是一個強大、可擴展的大型語言模型，專為在真實世界的企業用例中表現出色而設計。

工具 104b

119.7K 下載次數 21 標籤更新於 6 個月前

moondream

moondream2 是一個小型視覺語言模型，旨在邊緣設備上高效運行。

視覺 1.8b

119.5K 下載次數 18 標籤更新於 10 個月前

wizardcoder

最先進的程式碼生成模型

33b

117.3K 下載次數 67 標籤更新於 14 個月前

bakllava

BakLLaVA 是一個多模態模型，由 Mistral 7B 基礎模型以 LLaVA 架構擴增而成。

視覺 7b

109.9K 下載次數 17 標籤更新於 15 個月前

stablelm2

Stable LM 2 是一個最先進的 1.6B 和 12B 參數語言模型，以英語、西班牙語、德語、義大利語、法語、葡萄牙語和荷蘭語的多語言資料進行訓練。

1.6b 12b

108.2K 下載次數 84 標籤更新於 10 個月前

neural-chat

一個基於 Mistral 微調的模型，在領域和語言方面有良好的覆蓋範圍。

104.8K 下載次數 50 標籤更新於 14 個月前

reflection

一個高效能模型，以一種稱為「Reflection-tuning」的新技術訓練，該技術教導大型語言模型偵測其推理中的錯誤並修正方向。

70b

103.4K 下載次數 17 標籤更新於 6 個月前

wizard-math

專注於數學和邏輯問題的模型

7b 13b 70b

101.2K 下載次數 64 標籤更新於 14 個月前

llama3-gradient

此模型將 LLama-3 8B 的上下文長度從 8k 擴展到超過 100 萬個 tokens。

98.1K 下載次數 35 標籤更新於 10 個月前

llama3-chatqa

NVIDIA 基於 Llama 3 的模型，擅長對話式問答 (QA) 和檢索增強生成 (RAG)。

97.2K 下載次數 35 標籤更新於 10 個月前

sqlcoder

SQLCoder 是一個程式碼自動完成模型，在 StarCoder 上針對 SQL 生成任務進行了微調

7b 15b

94.4K 下載次數 48 標籤更新於 13 個月前

samantha-mistral

一個在哲學、心理學和人際關係方面訓練的伴侶助理。基於 Mistral。

90.2K 下載次數 49 標籤更新於 17 個月前

bge-large

BAAI 的嵌入模型，將文本映射到向量。

嵌入 335m

89.9K 下載次數 3 標籤更新於 7 個月前

xwinlm

基於 Llama 2 的對話模型，在各種基準測試中表現出競爭力。

84.4K 下載次數 80 標籤更新於 16 個月前

dolphincoder

Dolphin 模型系列的 7B 和 15B 未經審查的變體，基於 StarCoder2，擅長編碼。

7b 15b

84.2K 下載次數 35 標籤更新於 11 個月前

nous-hermes

來自 Nous Research 的基於 Llama 和 Llama 2 的通用模型。

82.4K 下載次數 63 標籤更新於 16 個月前

granite3.1-dense

IBM Granite 2B 和 8B 模型是純文本密集型大型語言模型，在超過 12 兆個 tokens 的資料上訓練，在 IBM 的初步測試中，與其前代產品相比，在性能和速度方面展現出顯著的改進。

工具 2b 8b

82.1K 下載次數 33 標籤更新於 7 週前

llava-phi3

一個新的小型 LLaVA 模型，從 Phi 3 Mini 微調而來。

視覺 3.8b

81.8K 下載次數 4 標籤更新於 10 個月前

phind-codellama

基於 Code Llama 的程式碼生成模型。

34b

81.6K 下載次數 49 標籤更新於 14 個月前

starling-lm

Starling 是一個大型語言模型，透過人工智慧回饋的強化學習訓練，專注於提高聊天機器人的實用性。

81.3K 下載次數 36 標籤更新於 11 個月前

solar

一個精巧而強大的 10.7B 大型語言模型，專為單輪對話設計。

10.7b

79.1K 下載次數 32 標籤更新於 15 個月前

yarn-llama2

Llama 2 的擴展，支援高達 128k tokens 的上下文。

78.9K 下載次數 67 標籤更新於 16 個月前

yi-coder

Yi-Coder 是一系列開源程式碼語言模型，以少於 100 億參數的規模，提供最先進的程式碼編寫效能。

1.5b 9b

77.1K 下載次數 67 標籤更新於 6 個月前

athene-v2

Athene-V2 是一個 720 億參數的模型，擅長程式碼自動完成、數學和日誌提取任務。

工具 72b

77K 下載次數 17 標籤更新於 3 個月前

wizardlm

基於 Llama 2 的通用模型。

75.8K 下載次數 73 標籤更新於 16 個月前

internlm2

InternLM2.5 是一個 70 億參數的模型，專為實際應用場景設計，具有出色的推理能力。

1m 1.8b 7b 20b

74.1K 下載次數 65 標籤更新於 6 個月前

falcon

一個由技術創新研究院 (TII) 建立的大型語言模型，用於摘要、文本生成和聊天機器人。

7b 40b 180b

70.2K 下載次數 38 標籤更新於 16 個月前

nemotron-mini

NVIDIA 出品，一個商業友善的小型語言模型，針對角色扮演、RAG QA 和函數呼叫進行了優化。

工具 4b

70.1K 下載次數 17 標籤更新於 5 個月前

nemotron

Llama-3.1-Nemotron-70B-Instruct 是一個由 NVIDIA 客製化的大型語言模型，旨在提高 LLM 生成的回應用戶查詢的實用性。

tools 70b

66.9K 下載次數 17 標籤更新於 4 個月前

deepscaler

Deepseek-R1-Distilled-Qwen-1.5B 的微調版本，僅用 15 億參數，在熱門數學評估中超越了 OpenAI 的 o1-preview 的效能。

1.5b

66.5K 下載次數 5 標籤更新於 4 週前

dolphin-phi

Eric Hartford 基於 Microsoft Research 的 Phi 語言模型所打造的 27 億參數無審查 Dolphin 模型。

2.7b

66K 下載次數 15 標籤更新於 14 個月前

orca2

Orca 2 由微軟研究院開發，是 Meta Llama 2 模型的微調版本。該模型旨在特別擅長推理。

63.8K 下載次數 33 標籤更新於 15 個月前

wizardlm-uncensored

Wizard LM 模型的無審查版本。

60.9K 下載次數 18 標籤更新於 16 個月前

stable-beluga

基於 Llama 2 模型，並在 Orca 風格的資料集上進行微調。原名 Free Willy。

7b 13b 70b

59K 下載次數 49 標籤更新於 16 個月前

granite3-dense

IBM Granite 2B 和 8B 模型旨在支援基於工具的使用案例，並支援檢索增強生成 (RAG)，簡化程式碼生成、翻譯和錯誤修復。

工具 2b 8b

58K 下載次數 33 標籤更新於 3 個月前

llama3-groq-tool-use

Groq 出品的一系列模型，代表了開源 AI 在工具使用/函數呼叫能力方面的重大進展。

工具 8b 70b

56.3K 下載次數 33 標籤更新於 7 個月前

paraphrase-multilingual

Sentence-transformers 模型，可用於叢集或語義搜尋等任務。

嵌入 278m

53.1K 下載次數 3 標籤更新於 7 個月前

deepseek-v2.5

DeekSeek-V2 的升級版本，整合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和程式碼編寫能力。

236b

50K 下載次數 7 標籤更新於 6 個月前

smallthinker

一個從 Qwen 2.5 3B Instruct 模型微調而來的新型小型推理模型。

3b

48.2K 下載次數 5 標籤更新於 2 個月前

medllama2

微調的 Llama 2 模型，基於開源醫療資料集回答醫療問題。

47.7K 下載次數 17 標籤更新於 16 個月前

meditron

從 Llama 2 改編而來的開源醫療大型語言模型，適用於醫療領域。

7b 70b

47.7K 下載次數 22 標籤更新於 15 個月前

aya-expanse

Cohere For AI 的語言模型，經過訓練，在 23 種不同語言中表現出色。

工具 8b 32b

46.8K 下載次數 33 標籤更新於 4 個月前

llama-pro

Llama 2 的擴展版本，專門整合通用語言理解和領域特定知識，尤其是在程式設計和數學方面。

45.8K 提取次數 33 標籤更新於 14 個月前

yarn-mistral

Mistral 的擴展，以支援 64K 或 128K 的上下文窗口。

45.2K 提取次數 33 標籤更新於 16 個月前

granite3-moe

IBM Granite 1B 和 3B 模型是 IBM 首個混合專家 (MoE) Granite 模型系列，專為低延遲使用而設計。

tools 1b 3b

44.4K 提取次數 33 標籤更新於 3 個月前

falcon3

一個高效能 AI 模型系列，參數小於 10B，透過創新的訓練技術，在科學、數學和程式碼方面表現出色。

1b 3b 7b 10b

42.4K 提取次數 17 標籤更新於 2 個月前

nexusraven

Nexus Raven 是一個 13B 指令微調模型，適用於函數呼叫任務。

41.7K 提取次數 32 標籤更新於 14 個月前

codeup

基於 Llama2 的出色程式碼生成模型。

39.7K 提取次數 19 標籤更新於 16 個月前

everythinglm

基於 Llama2 的未經審查模型，支援 16K 上下文窗口。

38.5K 提取次數 18 標籤更新於 14 個月前

nous-hermes2-mixtral

Nous Research 的 Nous Hermes 2 模型，現在基於 Mixtral 進行訓練。

8x7b

38.4K 提取次數 18 標籤更新於 2 個月前

snowflake-arctic-embed2

Snowflake 的前沿嵌入模型。Arctic Embed 2.0 增加了多語言支援，且不犧牲英語效能或擴展性。

嵌入 568m

37.4K 提取次數 3 標籤更新於 3 個月前

shieldgemma

ShieldGemma 是一組指令微調模型，用於評估文本提示輸入和文本輸出回應針對一組已定義安全策略的安全性。

2b 9b 27b

36.2K 提取次數 49 標籤更新於 5 個月前

granite3.1-moe

IBM Granite 1B 和 3B 模型是 IBM 的長上下文混合專家 (MoE) Granite 模型系列，專為低延遲使用而設計。

tools 1b 3b

35.7K 提取次數 33 標籤更新於 7 週前

marco-o1

阿里巴巴國際數位商業集團 (AIDC-AI) 為真實世界解決方案開發的開放大型推理模型。

33.3K 提取次數 5 標籤更新於 3 個月前

phi4-mini

Phi-4-mini 在多語言支援、推理和數學方面帶來了顯著的增強功能，現在終於支援期待已久的函數呼叫功能。

工具 3.8b

33.2K 提取次數 5 標籤更新於 12 天前

mathstral

MathΣtral：Mistral AI 設計的 7B 模型，專為數學推理和科學發現而設計。

32.8K 提取次數 17 標籤更新於 7 個月前

reader-lm

一系列將 HTML 內容轉換為 Markdown 內容的模型，這對於內容轉換任務非常有用。

0.5b 1.5b

32.6K 提取次數 33 標籤更新於 6 個月前

falcon2

Falcon2 是由 TII 構建並在超過 5T 個 token 上訓練的 11B 參數因果解碼器模型。

11b

32.4K 提取次數 17 標籤更新於 10 個月前

magicoder

🎩 Magicoder 是一個 7B 參數模型系列，使用 OSS-Instruct 在 75K 合成指令資料上進行訓練，OSS-Instruct 是一種透過開源程式碼片段啟發 LLM 的新穎方法。

32.2K 提取次數 18 標籤更新於 15 個月前

stablelm-zephyr

一款輕量級聊天模型，無需高階硬體即可實現準確且反應靈敏的輸出。

3b

32.1K 提取次數 17 標籤更新於 14 個月前

solar-pro

Solar Pro Preview：一款具有 220 億參數的先進大型語言模型 (LLM)，旨在適用於單個 GPU

22b

32.1K 提取次數 18 標籤更新於 5 個月前

codebooga

透過合併兩個現有程式碼模型而建立的高效能程式碼指令模型。

34b

31.4K 提取次數 16 標籤更新於 16 個月前

llama-guard3

Llama Guard 3 是一系列模型，經過微調，用於對 LLM 輸入和回應的內容安全進行分類。

1b 8b

30.7K 提取次數 33 標籤更新於 5 個月前

duckdb-nsql

由 MotherDuck 和 Numbers Station 製作的 7B 參數 text-to-SQL 模型。

30.5K 提取次數 17 標籤更新於 13 個月前

mistrallite

MistralLite 是一個基於 Mistral 微調的模型，增強了處理長上下文的能力。

30.1K 提取次數 17 標籤更新於 16 個月前

wizard-vicuna

Wizard Vicuna 是一個 13B 參數模型，基於 Llama 2，由 MelodysDreamj 訓練。

29.6K 提取次數 17 標籤更新於 16 個月前

exaone3.5

EXAONE 3.5 是由 LG AI Research 開發和發布的一系列指令微調的雙語（英語和韓語）生成模型，參數範圍從 2.4B 到 32B。

2.4b 7.8b 32b

29.3K 提取次數 13 標籤更新於 3 個月前

nuextract

一個 3.8B 模型，基於 Phi-3，在私有的高品質合成數據集上進行了微調，用於資訊提取。

3.8b

26.4K 提取次數 17 標籤更新於 7 個月前

opencoder

OpenCoder 是一個開放且可重現的程式碼 LLM 系列，包含 1.5B 和 8B 模型，支援英語和中文的聊天。

1.5b 8b

26.2K 提取次數 9 標籤更新於 3 個月前

megadolphin

MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的一種變體，通過將模型自身交錯創建。

120b

25.3K 提取次數 19 標籤更新於 14 個月前

command-r7b

Cohere R 系列中最小的模型，提供頂級的速度、效率和品質，以便在通用 GPU 和邊緣設備上構建強大的 AI 應用程式。

tools 7b

24.7K 提取次數 5 標籤更新於 7 週前

notux

一個頂級效能的專家混合模型，使用高品質數據進行了微調。

8x7b

24.4K 提取次數 18 標籤更新於 14 個月前

open-orca-platypus2

Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合併。專為聊天和程式碼生成而設計。

23.9K 提取次數 17 標籤更新於 16 個月前

notus

一個 7B 聊天模型，使用高品質數據進行微調，並基於 Zephyr。

23.7K 提取次數 18 標籤更新於 14 個月前

goliath

一個語言模型，通過將兩個微調的 Llama 2 70B 模型組合而成。

23K 提取次數 16 標籤更新於 16 個月前

bespoke-minicheck

由 Bespoke Labs 開發的最先進的事實查核模型。

22.7K 提取次數 17 標籤更新於 5 個月前

granite-embedding

IBM Granite Embedding 30M 和 278M 模型是純文本密集雙編碼器嵌入模型，其中 30M 僅提供英語版本，而 278M 適用於多語言用例。

嵌入 30m 278m

21.6K 提取次數 6 標籤更新於 2 個月前

tulu3

Tülu 3 是一個領先的指令遵循模型系列，由 Allen Institute for AI 提供完全開源的數據、程式碼和配方。