模型庫 - Ollama 框架

工具 0.5b 1.5b 3b 7b 14b 32b 72b

7.6M 下載次數 68 標籤更新於 9 個月前

qwen2.5

Qwen2.5 模型在阿里巴巴最新的大規模數據集上進行預訓練，包含多達 18 兆個 Token。該模型支援高達 128K 個 Token，並具有多語言支援。

5.2M 下載次數 133 標籤更新於 5 個月前

qwen2.5-coder

最新的程式碼專用 Qwen 模型系列，在程式碼生成、程式碼推理和程式碼修復方面有顯著改進。

工具 0.5b 1.5b 3b 7b 14b 32b

4.5M 下載次數 196 標籤更新於 4 個月前

qwen

Qwen 1.5 是阿里巴巴雲端推出的一系列大型語言模型，參數範圍從 0.5B 到 110B。

0.5b 1.8b 4b 7b 14b 32b 72b 110b

4.5M 下載次數 379 標籤更新於 10 個月前

gemma

Gemma 是 Google DeepMind 建構的輕量級、最先進的開放模型系列。已更新至 1.1 版本。

2b 7b

4.4M 下載次數 102 標籤更新於 11 個月前

qwen2

Qwen2 是阿里巴巴集團推出的新系列大型語言模型

工具 0.5b 1.5b 7b 72b

4.1M 下載次數 97 標籤更新於 6 個月前

llava

🌋 LLaVA 是一種新型端到端訓練的大型多模態模型，它結合了視覺編碼器和 Vicuna，用於通用視覺和語言理解。已更新至 1.6 版本。

視覺 7b 13b 34b

4M 下載次數 98 標籤更新於 13 個月前

gemma2

Google Gemma 2 是一款高效能且效率高的模型，提供三種尺寸：2B、9B 和 27B。

2b 9b 27b

3.4M 下載次數 94 標籤更新於 7 個月前

llama2

Llama 2 是一系列基礎語言模型，參數範圍從 7B 到 70B。

7b 13b 70b

3M 拉取次數 102 標籤更新於 14 個月前

phi3

Phi-3 是微軟開發的輕量級 3B (Mini) 和 14B (Medium) 最先進開放模型系列。

3.8b 14b

2.9M 拉取次數 72 標籤更新於 7 個月前

codellama

一個大型語言模型，可以使用文字提示來生成和討論程式碼。

7b 13b 34b 70b

1.8M 拉取次數 199 標籤更新於 7 個月前

mxbai-embed-large

來自 mixedbread.ai 的最先進大型嵌入模型

嵌入 335m

1.7M 拉取次數 4 標籤更新於 10 個月前

llama3.2-vision

Llama 3.2 Vision 是一系列指令微調的圖像推理生成模型，具有 11B 和 90B 兩種尺寸。

視覺 11b 90b

1.5M 拉取次數 9 標籤更新於 4 個月前

tinyllama

TinyLlama 專案是一個開放的計畫，旨在以 3 兆個 tokens 訓練一個精巧的 1.1B Llama 模型。

1.1b

1.3M 拉取次數 36 標籤更新於 14 個月前

mistral-nemo

一個最先進的 12B 模型，具有 128k 上下文長度，由 Mistral AI 與 NVIDIA 合作建構。

工具 12b

1.3M 拉取次數 17 標籤更新於 7 個月前

starcoder2

StarCoder2 是下一代透明訓練的開放程式碼 LLM，提供三種尺寸：3B、7B 和 15B 參數。

3b 7b 15b

897.6K 拉取次數 67 標籤更新於 6 個月前

deepseek-v3

一個強大的混合專家 (MoE) 語言模型，總共有 671B 參數，每次 token 啟用 37B。

671b

748.8K 拉取次數 5 標籤更新於 8 週前

llama2-uncensored

由 George Sung 和 Jarrad Hope 開發的無審查 Llama 2 模型。

7b 70b

729K 拉取次數 34 標籤更新於 16 個月前

deepseek-coder-v2

一個開源的混合專家程式碼語言模型，在程式碼特定任務中達到與 GPT4-Turbo 相媲美的效能。

16b 236b

722.2K 拉取次數 64 標籤更新於 6 個月前

snowflake-arctic-embed

Snowflake 出品的一套文字嵌入模型，針對效能進行了最佳化。

嵌入 22m 33m 110m 137m 335m

697.7K 拉取次數 16 標籤更新於 10 個月前

deepseek-coder

DeepSeek Coder 是一個功能強大的程式碼模型，使用兩兆個程式碼和自然語言 tokens 進行訓練。

1.3b 6.7b 33b

601.5K 拉取次數 102 標籤更新於 14 個月前

mixtral

Mistral AI 出品的一組開放權重的混合專家 (MoE) 模型，具有 8x7b 和 8x22b 兩種參數尺寸。

工具 8x7b 8x22b

582.7K 拉取次數 70 標籤更新於 2 個月前

bge-m3

BGE-M3 是 BAAI 的新模型，以其在多功能性、多語言性和多粒度方面的多樣性而著稱。

嵌入 567m

556.5K 拉取次數 3 標籤更新於 7 個月前

minicpm-v

一系列多模態 LLM (MLLM)，專為視覺語言理解而設計。

視覺 8b

537.1K 拉取次數 17 標籤更新於 3 個月前

codegemma

CodeGemma 是一系列功能強大、輕量級的模型，可以執行各種程式碼任務，例如填空中程式碼完成、程式碼生成、自然語言理解、數學推理和指令遵循。

2b 7b

530.6K 拉取次數 85 標籤更新於 7 個月前

dolphin-mixtral

無審查的 8x7b 和 8x22b 微調模型，基於 Mixtral 混合專家模型，擅長程式碼任務。由 Eric Hartford 創建。

8x7b 8x22b

522.3K 拉取次數 70 標籤更新於 2 個月前

openthinker

一個完全開源的推理模型系列，使用透過提煉 DeepSeek-R1 衍生出的資料集建構。

7b 32b

509.8K 拉取次數 9 標籤更新於 3 週前

phi

Phi-2：微軟研究部門開發的 2.7B 語言模型，展現出色的推理和語言理解能力。

2.7b

497K 拉取次數 18 標籤更新於 14 個月前

llava-llama3

一個從 Llama 3 Instruct 微調而來的 LLaVA 模型，在多個基準測試中獲得更好的分數。

視覺 8b

448.8K 拉取次數 4 標籤更新於 10 個月前

dolphin3

Dolphin 3.0 Llama 3.1 8B 🐬 是 Dolphin 系列指令微調模型的下一代，旨在成為終極通用本地模型，支援程式碼、數學、代理、函數呼叫和一般用例。

8b

388.1K 下載次數 5 標籤更新於 2 個月前

smollm2

SmolLM2 是一系列精巧的語言模型，提供三種尺寸：135M、360M 和 1.7B 參數。

工具 135m 360m 1.7b

371.5K 下載次數 49 標籤更新於 4 個月前

wizardlm2

來自 Microsoft AI 的最先進大型語言模型，在複雜的聊天、多語言、推理和代理使用案例中具有更佳的效能。

7b 8x22b

356.8K 下載次數 22 標籤更新於 11 個月前

olmo2

OLMo 2 是一個新的 7B 和 13B 模型系列，訓練資料高達 5T tokens。這些模型與同等大小的完全開放模型相當或更佳，並且在英語學術基準測試中，與 Llama 3.1 等開放權重模型相比也具有競爭力。

353.9K 下載次數 9 標籤更新於 8 週前

dolphin-mistral

基於 Mistral 的無審查 Dolphin 模型，擅長程式碼編寫任務。已更新至 2.8 版本。

325.9K 下載次數 120 標籤更新於 11 個月前

all-minilm

基於超大型句子層級資料集的嵌入模型。

嵌入 22m 33m

311.6K 下載次數 10 標籤更新於 10 個月前

mistral-small

Mistral Small 3 在 70B 以下的「小型」大型語言模型類別中，樹立了新的基準。

工具 22b 24b

298.6K 下載次數 21 標籤更新於 5 週前

dolphin-llama3

Dolphin 2.9 是 Eric Hartford 基於 Llama 3 開發的新模型，具有 8B 和 70B 兩種尺寸，並具備多樣化的指令、對話和程式碼編寫技能。

293.5K 下載次數 53 標籤更新於 10 個月前

command-r

Command R 是一個針對對話互動和長上下文任務優化的大型語言模型。

工具 35b

283K 下載次數 32 標籤更新於 6 個月前

orca-mini

一個通用模型，參數範圍從 30 億到 700 億，適用於入門級硬體。

3b 7b 13b 70b

277.3K 下載次數 119 標籤更新於 16 個月前

yi

Yi 1.5 是一個高效能的雙語語言模型。

6b 9b 34b

267.3K 下載次數 174 標籤更新於 10 個月前

hermes3

Hermes 3 是 Nous Research 旗艦 Hermes 系列 LLM 的最新版本

工具 3b 8b 70b 405b

264.7K 下載次數 65 標籤更新於 2 個月前

phi3.5

一個輕量級 AI 模型，具有 38 億參數，效能超越了相似和更大尺寸的模型。

3.8b

250K 下載次數 17 標籤更新於 6 個月前

zephyr

Zephyr 是一系列 Mistral 和 Mixtral 模型的微調版本，經過訓練可作為有用的助手。

7b 141b

238.3K 下載次數 40 標籤更新於 11 個月前

codestral

Codestral 是 Mistral AI 首個專為程式碼生成任務設計的程式碼模型。

22b

228K 下載次數 17 標籤更新於 6 個月前

granite-code

IBM 開發的一系列用於程式碼智慧的開放基礎模型

3b 8b 20b 34b

191.6K 下載次數 162 標籤更新於 6 個月前

smollm

🪐 一系列小型模型，具有 135M、360M 和 1.7B 參數，在新高品質資料集上訓練。

135m 360m 1.7b

188.4K 下載次數 94 標籤更新於 6 個月前

starcoder

StarCoder 是一個在 80 多種程式語言上訓練的程式碼生成模型。

1b 3b 7b 15b

187.7K 下載次數 100 標籤更新於 16 個月前

wizard-vicuna-uncensored

Wizard Vicuna Uncensored 是 Eric Hartford 基於 Llama 2 Uncensored 開發的 7B、13B 和 30B 參數模型。

7b 13b 30b

185.8K 下載次數 49 標籤更新於 16 個月前

vicuna

基於 Llama 和 Llama 2 的通用聊天模型，上下文長度為 2K 至 16K。

7b 13b 33b

176.2K 拉取次數 111 標籤更新於 16 個月前

mistral-openorca

Mistral OpenOrca 是一個 70 億參數的模型，基於 Mistral 7B 模型並使用 OpenOrca 資料集進行微調。

167.1K 拉取次數 17 標籤更新於 17 個月前

llama2-chinese

基於 Llama 2 的模型，經過微調以提升中文對話能力。

149.9K 拉取次數 35 標籤更新於 16 個月前

openchat

一系列開源模型，在各種數據上訓練，在多項基準測試中超越 ChatGPT。已更新至 3.5-0106 版本。

145.4K 拉取次數 50 標籤更新於 14 個月前

codegeex4

一個適用於人工智慧軟體開發場景的多功能模型，包括程式碼自動完成。

9b

139.2K 拉取次數 17 標籤更新於 8 個月前

aya

由 Cohere 發布的 Aya 23，是一個最新的多語言模型系列，支援 23 種語言。

8b 35b

136.4K 拉取次數 33 標籤更新於 9 個月前

codeqwen

CodeQwen1.5 是一個大型語言模型，在大量的程式碼資料上預訓練。

133K 拉取次數 30 標籤更新於 8 個月前

deepseek-llm

一個先進的語言模型，使用 2 兆雙語 tokens 精心打造。

7b 67b

132.1K 拉取次數 64 標籤更新於 15 個月前

deepseek-v2

一個強大、經濟且高效的專家混合語言模型。

16b 236b

128.3K 拉取次數 34 標籤更新於 8 個月前

mistral-large

Mistral Large 2 是 Mistral 最新的旗艦模型，在程式碼生成、數學和推理方面能力顯著提升，具有 128k 上下文窗口，並支援數十種語言。

工具 123b

125.1K 拉取次數 32 標籤更新於 3 個月前

glm4

一個強大的多語言通用語言模型，具有與 Llama 3 相匹敵的競爭力。

9b

123.5K 拉取次數 32 標籤更新於 8 個月前

stable-code

Stable Code 3B 是一個程式碼模型，具有指令和程式碼自動完成變體，其性能與 Code Llama 7B 等模型相當，但模型大小僅為其 2.5 分之一。

3b

122.4K 拉取次數 36 標籤更新於 11 個月前

openhermes

OpenHermes 2.5 是一個 7B 模型，由 Teknium 在 Mistral 上進行微調，使用完全開放的資料集。

122.1K 拉取次數 35 標籤更新於 14 個月前

nous-hermes2

Nous Research 強大的模型系列，在科學討論和編碼任務方面表現出色。

10.7b 34b

121.9K 拉取次數 33 標籤更新於 14 個月前

qwen2-math

Qwen2 Math 是一系列基於 Qwen2 LLMs 構建的專業數學語言模型，其數學能力顯著優於開源模型，甚至閉源模型（例如 GPT4o）。

1.5b 7b 72b

120.6K 拉取次數 52 標籤更新於 6 個月前

tinydolphin

一個實驗性的 1.1B 參數模型，由 Eric Hartford 在新的 Dolphin 2.8 資料集上訓練，並基於 TinyLlama。

1.1b

120.5K 拉取次數 18 標籤更新於 13 個月前

command-r-plus

Command R+ 是一個強大、可擴展的大型語言模型，專為在真實世界的企業用例中表現出色而打造。

工具 104b

119.7K 拉取次數 21 標籤更新於 6 個月前

moondream

moondream2 是一個小型的視覺語言模型，旨在在邊緣設備上高效運行。

視覺 1.8b

117.2K 拉取次數 18 標籤更新於 10 個月前

wizardcoder

最先進的程式碼生成模型

33b

117.2K 拉取次數 67 標籤更新於 14 個月前

bakllava

BakLLaVA 是一個多模態模型，由 Mistral 7B 基礎模型與 LLaVA 架構擴增而成。

視覺 7b

109.7K 下載次數 17 標籤更新於 15 個月前

stablelm2

Stable LM 2 是一個最先進的 1.6B 和 12B 參數語言模型，使用多語言資料進行訓練，語言包括英文、西班牙文、德文、義大利文、法文、葡萄牙文和荷蘭文。

1.6b 12b

108.1K 下載次數 84 標籤更新於 10 個月前

neural-chat

一個基於 Mistral 微調的模型，在領域和語言方面有良好的覆蓋率。

104.7K 下載次數 50 標籤更新於 14 個月前

reflection

一個高效能模型，採用名為「Reflection-tuning」的新技術進行訓練，該技術教導 LLM 偵測其推理中的錯誤並修正方向。

70b

103.4K 下載次數 17 標籤更新於 6 個月前

wizard-math

專注於數學和邏輯問題的模型

7b 13b 70b

101.1K 下載次數 64 標籤更新於 14 個月前

llama3-gradient

此模型將 LLama-3 8B 的上下文長度從 8k 擴展到超過 1 百萬個 token。

98.1K 下載次數 35 標籤更新於 10 個月前

llama3-chatqa

NVIDIA 基於 Llama 3 的模型，擅長對話式問答 (QA) 和檢索增強生成 (RAG)。

97.2K 下載次數 35 標籤更新於 10 個月前

sqlcoder

SQLCoder 是一個程式碼完成模型，在 StarCoder 上進行微調，用於 SQL 生成任務

7b 15b

93.7K 下載次數 48 標籤更新於 13 個月前

samantha-mistral

一個在哲學、心理學和人際關係方面訓練有素的伴侶助理。基於 Mistral。

90.1K 下載次數 49 標籤更新於 17 個月前

bge-large

BAAI 的嵌入模型，將文本映射到向量。

嵌入 335m

89.7K 下載次數 3 標籤更新於 7 個月前

xwinlm

基於 Llama 2 的對話模型，在各種基準測試中表現出競爭力。

84.4K 下載次數 80 標籤更新於 16 個月前

dolphincoder

Dolphin 模型系列的 7B 和 15B 未經審查變體，擅長編碼，基於 StarCoder2。

7b 15b

84.2K 下載次數 35 標籤更新於 11 個月前

nous-hermes

Nous Research 基於 Llama 和 Llama 2 的通用模型。

82.3K 下載次數 63 標籤更新於 16 個月前

granite3.1-dense

IBM Granite 2B 和 8B 模型是純文本密集型 LLM，使用超過 12 兆個 token 的資料進行訓練，在 IBM 的初步測試中，效能和速度都比其前代產品有了顯著提升。

工具 2b 8b

81.8K 下載次數 33 標籤更新於 7 週前

llava-phi3

一個基於 Phi 3 Mini 微調的全新小型 LLaVA 模型。

視覺 3.8b

81.7K 下載次數 4 標籤更新於 10 個月前

phind-codellama

基於 Code Llama 的程式碼生成模型。

34b

81.5K 下載次數 49 標籤更新於 14 個月前

starling-lm

Starling 是一個大型語言模型，透過人工智慧回饋的強化學習進行訓練，專注於提高聊天機器人的實用性。

81.3K 下載次數 36 標籤更新於 11 個月前

solar

一個精巧但功能強大的 10.7B 大型語言模型，專為單輪對話而設計。

10.7b

79.1K 下載次數 32 標籤更新於 15 個月前

yarn-llama2

Llama 2 的擴展，支援高達 128k 個 token 的上下文。

78.9K 下載次數 67 標籤更新於 16 個月前

yi-coder

Yi-Coder 是一系列開源程式碼語言模型，以少於 100 億個參數提供最先進的編碼效能。

1.5b 9b

77K 下載次數 67 標籤更新於 6 個月前

athene-v2

Athene-V2 是一個 72B 參數模型，擅長程式碼完成、數學和日誌提取任務。

工具 72b

76.9K 下載次數 17 標籤更新於 3 個月前

wizardlm

基於 Llama 2 的通用模型。

75.8K 下載次數 73 標籤更新於 16 個月前

internlm2

InternLM2.5 是一個 7B 參數模型，專為具有出色推理能力的實際場景量身定制。

1m 1.8b 7b 20b

74.1K 下載次數 65 標籤更新於 6 個月前

falcon

技術創新研究所 (TII) 建構的大型語言模型，用於摘要、文本生成和聊天機器人。

7b 40b 180b

70.2K 提取次數 38 標籤已更新 16 個月前

nemotron-mini

NVIDIA 開發的商業友善小型語言模型，針對角色扮演、RAG QA 和函數呼叫進行了最佳化。

工具 4b

69.9K 提取次數 17 標籤已更新 5 個月前

nemotron

Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 客製化的大型語言模型，旨在提升 LLM 生成回應使用者查詢時的實用性。

工具 70b

66.9K 提取次數 17 標籤已更新 4 個月前

deepscaler

Deepseek-R1-Distilled-Qwen-1.5B 的微調版本，僅以 1.5B 參數在熱門數學評估中超越 OpenAI 的 o1-preview 效能。

1.5b

66.3K 提取次數 5 標籤已更新 4 週前

dolphin-phi

Eric Hartford 開發的 2.7B 未經審查 Dolphin 模型，基於微軟研究的 Phi 語言模型。

2.7b

65.9K 提取次數 15 標籤已更新 14 個月前

orca2

Orca 2 由微軟研究部門建立，是 Meta Llama 2 模型的微調版本。該模型旨在於推理方面表現出色。

63.8K 提取次數 33 標籤已更新 15 個月前

wizardlm-uncensored

Wizard LM 模型的未經審查版本

60.9K 提取次數 18 標籤已更新 16 個月前

stable-beluga

基於 Llama 2 模型並在 Orca 風格資料集上進行微調的模型。最初名為 Free Willy。

7b 13b 70b

59K 提取次數 49 標籤已更新 16 個月前

granite3-dense

IBM Granite 2B 和 8B 模型旨在支援基於工具的使用案例，並支援檢索增強生成 (RAG)，簡化程式碼生成、翻譯和錯誤修復。

工具 2b 8b

57.9K 提取次數 33 標籤已更新 3 個月前

llama3-groq-tool-use

Groq 的一系列模型，代表開源 AI 在工具使用/函數呼叫能力方面的重大進展。

工具 8b 70b

56.2K 提取次數 33 標籤已更新 7 個月前

paraphrase-multilingual

Sentence-transformers 模型，可用於諸如叢集或語義搜尋等任務。

嵌入 278m

53K 提取次數 3 標籤已更新 7 個月前

deepseek-v2.5

DeepSeek-V2 的升級版本，整合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和編碼能力。

236b

49.9K 提取次數 7 標籤已更新 6 個月前

smallthinker

從 Qwen 2.5 3B Instruct 模型微調而來的新型小型推理模型。

3b

48.1K 提取次數 5 標籤已更新 2 個月前

medllama2

微調的 Llama 2 模型，用於根據開源醫療資料集回答醫療問題。

47.7K 提取次數 17 標籤已更新 16 個月前

meditron

從 Llama 2 改編而來的開源醫療大型語言模型，適用於醫療領域。

7b 70b

47.6K 提取次數 22 標籤已更新 15 個月前

aya-expanse

Cohere For AI 的語言模型，經過訓練，可在 23 種不同語言中表現良好。

工具 8b 32b

46.6K 提取次數 33 標籤已更新 4 個月前

llama-pro

Llama 2 的擴展版本，專門整合通用語言理解能力和特定領域知識，尤其是在程式設計和數學方面。

45.7K 提取次數 33 標籤已更新 14 個月前

yarn-mistral

Mistral 的擴展版本，用於支援 64K 或 128K 的上下文視窗。

45.2K 提取次數 33 標籤已更新 16 個月前

granite3-moe

IBM Granite 1B 和 3B 模型是 IBM 推出的首批混合專家 (MoE) Granite 模型，專為低延遲使用而設計。

工具 1b 3b

44.4K 提取次數 33 標籤已更新 3 個月前

falcon3

一系列高效的 AI 模型，參數少於 10B，透過創新的訓練技術，在科學、數學和編碼方面表現出色。

1b 3b 7b 10b

42.2K 提取次數 17 標籤已更新 2 個月前

nexusraven

Nexus Raven 是一個 13B 指令微調模型，適用於函數呼叫任務。

41.7K 提取次數 32 標籤已更新 13 個月前

codeup

基於 Llama 2 的出色程式碼生成模型。

39.7K 提取次數 19 標籤更新於 16 個月前

everythinglm

未經審查的 Llama2 基礎模型，支援 16K 上下文視窗。

38.5K 提取次數 18 標籤更新於 14 個月前

nous-hermes2-mixtral

Nous Research 的 Nous Hermes 2 模型，現在基於 Mixtral 訓練。

8x7b

38.4K 提取次數 18 標籤更新於 2 個月前

snowflake-arctic-embed2

Snowflake 的前沿嵌入模型。Arctic Embed 2.0 增加了多語言支援，且不犧牲英文效能或擴展性。

嵌入 568m

37.2K 提取次數 3 標籤更新於 3 個月前

shieldgemma

ShieldGemma 是一組指令調整模型，用於評估文字提示輸入和文字輸出回應針對一組已定義安全策略的安全性。

2b 9b 27b

36.1K 提取次數 49 標籤更新於 5 個月前

granite3.1-moe

IBM Granite 1B 和 3B 模型是 IBM 的長上下文專家混合模型 (MoE) Granite 模型，專為低延遲使用而設計。

工具 1b 3b

35.5K 提取次數 33 標籤更新於 7 週前

marco-o1

阿里巴巴國際數位商業集團 (AIDC-AI) 為真實世界解決方案開發的開放大型推理模型。

33.3K 提取次數 5 標籤更新於 3 個月前

mathstral

MathΣtral：Mistral AI 設計的 7B 模型，專為數學推理和科學發現而設計。

32.7K 提取次數 17 標籤更新於 7 個月前

reader-lm

一系列將 HTML 內容轉換為 Markdown 內容的模型，適用於內容轉換任務。

0.5b 1.5b

32.5K 提取次數 33 標籤更新於 6 個月前

falcon2

Falcon2 是由 TII 建構並在超過 5T tokens 上訓練的 11B 參數因果解碼器模型。

11b

32.3K 提取次數 17 標籤更新於 10 個月前

magicoder

🎩 Magicoder 是一個 7B 參數模型系列，使用 OSS-Instruct（一種以開源程式碼片段啟發 LLM 的新穎方法）在 75K 合成指令資料上進行訓練。

32.2K 提取次數 18 標籤更新於 15 個月前

stablelm-zephyr

一個輕量級聊天模型，允許準確且反應靈敏的輸出，而無需高階硬體。

3b

32.1K 提取次數 17 標籤更新於 14 個月前

phi4-mini

Phi-4-mini 在多語言支援、推理和數學方面帶來了顯著的增強功能，現在，期待已久的函數呼叫功能終於獲得支援。

工具 3.8b

32.1K 提取次數 5 標籤更新於 11 天前

solar-pro

Solar Pro 預覽版：一個先進的大型語言模型 (LLM)，具有 220 億個參數，旨在放入單個 GPU 中

22b

32.1K 提取次數 18 標籤更新於 5 個月前

codebooga

通過合併兩個現有程式碼模型創建的高效能程式碼指令模型。

34b

31.4K 提取次數 16 標籤更新於 16 個月前

llama-guard3

Llama Guard 3 是一系列針對 LLM 輸入和回應的內容安全分類進行微調的模型。

1b 8b

30.6K 提取次數 33 標籤更新於 5 個月前

duckdb-nsql

MotherDuck 和 Numbers Station 製作的 7B 參數 text-to-SQL 模型。

30.5K 提取次數 17 標籤更新於 13 個月前

mistrallite

MistralLite 是一個基於 Mistral 微調的模型，具有增強的長上下文處理能力。

30.1K 提取次數 17 標籤更新於 16 個月前

wizard-vicuna

Wizard Vicuna 是一個由 MelodysDreamj 訓練，基於 Llama 2 的 13B 參數模型。

29.6K 提取次數 17 標籤更新於 16 個月前

exaone3.5

EXAONE 3.5 是 LG AI Research 開發和發布的一系列指令調整型雙語（英語和韓語）生成模型，參數範圍從 2.4B 到 32B。

2.4b 7.8b 32b

29.2K 提取次數 13 標籤更新於 3 個月前

nuextract

一個基於 Phi-3，在用於資訊提取的私有高品質合成資料集上微調的 3.8B 模型。

3.8b

26.4K 提取次數 17 標籤更新於 7 個月前

opencoder

OpenCoder 是一個開放且可重現的程式碼 LLM 系列，包含 1.5B 和 8B 模型，支援英語和中文語言的聊天。

1.5b 8b

26.1K 提取次數 9 標籤更新於 3 個月前

megadolphin

MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的變體，透過將模型與自身交錯創建而成。

120b

25.3K 提取次數 19 標籤更新於 14 個月前

command-r7b

Cohere R 系列中最小的模型，在通用 GPU 和邊緣設備上提供頂級的速度、效率和品質，以構建強大的 AI 應用程式。

工具 7b

24.5K 提取次數 5 標籤更新於 7 週前

notux

頂尖效能的專家混合模型，使用高品質資料進行微調。

8x7b

24.4K 提取次數 18 標籤更新於 14 個月前

open-orca-platypus2

Open Orca OpenChat 模型與 Garage-bAInd Platypus 2 模型的合併。專為聊天和程式碼生成而設計。

23.9K 提取次數 17 標籤更新於 16 個月前

notus

基於 Zephyr，使用高品質資料微調的 7B 聊天模型。

23.7K 提取次數 18 標籤更新於 14 個月前

goliath

一個語言模型，透過將兩個微調的 Llama 2 70B 模型合併為一個而創建。

23K 提取次數 16 標籤更新於 16 個月前

bespoke-minicheck

由 Bespoke Labs 開發的最新事實查核模型。

22.7K 提取次數 17 標籤更新於 5 個月前

granite-embedding

IBM Granite Embedding 30M 和 278M 模型是純文字密集雙編碼器嵌入模型，其中 30M 僅提供英文版本，而 278M 則適用於多語言用例。

embedding 30m 278m

21.3K 提取次數 6 標籤更新於 2 個月前

tulu3

Tülu 3 是一個領先的指令遵循模型系列，由艾倫人工智慧研究所 (The Allen Institute for AI) 提供完全開源的資料、程式碼和配方。