
-
deepseek-r1
DeepSeek 的第一代推理模型,效能與 OpenAI-o1 相近,包含六個基於 Llama 和 Qwen,從 DeepSeek-R1 提煉出的密集模型。
1.5b 7b 8b 14b 32b 70b 671b7.7M 下載次數 28 標籤 更新時間 13 days ago
-
llama3.3
最新頂尖 70B 模型。Llama 3.3 70B 的效能與 Llama 3.1 405B 模型相近。
工具 70b1.1M 下載次數 14 標籤 更新時間 8 weeks ago
-
phi4
Phi-4 是微軟推出的 14B 參數、頂尖的開放模型。
14b310.5K 下載次數 5 標籤 更新時間 3 weeks ago
-
llama3.2
Meta 的 Llama 3.2 推出 1B 和 3B 小型模型。
工具 1b 3b8.1M 下載次數 63 標籤 更新時間 4 months ago
-
llama3.1
Llama 3.1 是 Meta 推出的最新頂尖模型,提供 8B、70B 和 405B 參數尺寸。
工具 8b 70b 405b21.9M 下載次數 93 標籤 更新時間 2 months ago
-
nomic-embed-text
一個高效能的開放嵌入模型,具有大型 token 上下文視窗。
嵌入14M 下載次數 3 標籤 更新時間 11 months ago
-
mistral
Mistral AI 發布的 7B 模型,已更新至 0.3 版本。
工具 7b8.5M 下載次數 84 標籤 更新時間 6 months ago
-
llama3
Meta Llama 3:目前功能最強大的公開 LLM。
8b 70b7.4M 下載次數 68 標籤 更新時間 8 months ago
-
qwen
Qwen 1.5 是阿里巴巴雲推出的一系列大型語言模型,參數規模從 0.5B 到 110B。
0.5b 1.8b 4b 7b 14b 32b 72b 110b4.3M 下載次數 379 標籤 更新時間 9 months ago
-
gemma
Gemma 是 Google DeepMind 開發的一系列輕量級、頂尖的開放模型。已更新至 1.1 版本。
2b 7b4.3M 下載次數 102 標籤 更新時間 10 months ago
-
qwen2
Qwen2 是阿里巴巴集團推出的新系列大型語言模型。
工具 0.5b 1.5b 7b 72b4.1M 下載次數 97 標籤 更新時間 4 months ago
-
qwen2.5
Qwen2.5 模型在阿里巴巴最新的大規模資料集上進行預訓練,涵蓋高達 18 兆個 token。該模型支援高達 128K 個 token,並具有多語言支援。
工具 0.5b 1.5b 3b 7b 14b 32b 72b3.6M 下載次數 133 標籤 更新時間 4 months ago
-
llama2
Llama 2 是一系列基礎語言模型,參數規模從 7B 到 70B。
7b 13b 70b2.9M 下載次數 102 標籤 更新時間 13 months ago
-
llava
🌋 LLaVA 是一種新穎的端到端訓練大型多模態模型,結合了視覺編碼器和 Vicuna,用於通用視覺和語言理解。已更新至 1.6 版本。
視覺 7b 13b 34b2.9M 下載次數 98 標籤 更新時間 12 months ago
-
phi3
Phi-3 是微軟推出的一系列輕量級 3B (Mini) 和 14B (Medium) 頂尖開放模型。
3.8b 14b2.9M 下載次數 72 標籤 更新時間 6 months ago
-
gemma2
Google Gemma 2 是一個高效能且效率高的模型,提供三種尺寸:2B、9B 和 27B。
2b 9b 27b2.5M 下載次數 94 標籤 更新時間 6 months ago
-
qwen2.5-coder
最新的程式碼專用 Qwen 模型系列,在程式碼生成、程式碼推理和程式碼修復方面有顯著改進。
工具 0.5b 1.5b 3b 7b 14b 32b1.9M 下載次數 196 標籤 更新於 2 個月前
-
codellama
一個大型語言模型,可以使用文字提示來生成和討論程式碼。
7b 13b 34b 70b1.7M 下載次數 199 標籤 更新於 6 個月前
-
tinyllama
TinyLlama 專案是一個開放的努力,旨在用 3 兆個 tokens 訓練一個精巧的 1.1B Llama 模型。
1.1b1.3M 下載次數 36 標籤 更新於 13 個月前
-
mxbai-embed-large
來自 mixedbread.ai 的最先進大型嵌入模型
嵌入 335m1.2M 下載次數 4 標籤 更新於 9 個月前
-
mistral-nemo
一個最先進的 12B 模型,具有 128k 上下文長度,由 Mistral AI 與 NVIDIA 合作構建。
工具 12b1.1M 下載次數 17 標籤 更新於 6 個月前
-
llama3.2-vision
Llama 3.2 Vision 是一系列指令調整的圖像推理生成模型,尺寸有 11B 和 90B。
視覺 11b 90b1M 下載次數 9 標籤 更新於 2 個月前
-
starcoder2
StarCoder2 是下一代透明訓練的開放程式碼 LLM,有三種尺寸:3B、7B 和 15B 參數。
3b 7b 15b831.7K 下載次數 67 標籤 更新於 5 個月前
-
snowflake-arctic-embed
Snowflake 的一套文字嵌入模型,針對效能進行了最佳化。
嵌入 22m 33m 110m 137m 335m604.4K 下載次數 16 標籤 更新於 9 個月前
-
mixtral
Mistral AI 開放權重的一組專家混合 (MoE) 模型,參數大小為 8x7b 和 8x22b。
工具 8x7b 8x22b545.1K 下載次數 70 標籤 更新於 6 週前
-
deepseek-coder-v2
一個開源的專家混合程式碼語言模型,在程式碼特定任務中實現了與 GPT4-Turbo 相媲美的效能。
16b 236b536.4K 下載次數 64 標籤 更新於 5 個月前
-
dolphin-mixtral
基於 Mixtral 專家混合模型微調的未經審查的 8x7b 和 8x22b 模型,擅長程式碼編寫任務。由 Eric Hartford 創建。
8x7b 8x22b489.4K 下載次數 70 標籤 更新於 6 週前
-
phi
Phi-2:微軟研究院的 2.7B 語言模型,展示了出色的推理和語言理解能力。
2.7b480.3K 下載次數 18 標籤 更新於 13 個月前
-
codegemma
CodeGemma 是一系列功能強大、輕量級的模型,可以執行各種程式碼編寫任務,例如填空中程式碼完成、程式碼生成、自然語言理解、數學推理和指令遵循。
2b 7b476.7K 下載次數 85 標籤 更新於 6 個月前
-
deepseek-coder
DeepSeek Coder 是一個功能強大的程式碼編寫模型,在兩兆個程式碼和自然語言 tokens 上進行訓練。
1.3b 6.7b 33b469.9K 下載次數 102 標籤 更新於 13 個月前
-
llama2-uncensored
George Sung 和 Jarrad Hope 開發的未經審查的 Llama 2 模型。
7b 70b458.9K 下載次數 34 標籤 更新於 15 個月前
-
wizardlm2
來自 Microsoft AI 的最先進大型語言模型,在複雜的聊天、多語言、推理和代理使用案例中具有改進的效能。
7b 8x22b349.9K 下載次數 22 標籤 更新於 9 個月前
-
dolphin-mistral
基於 Mistral 的未經審查的 Dolphin 模型,擅長程式碼編寫任務。已更新至 2.8 版本。
7b312.8K 下載次數 120 標籤 更新於 10 個月前
-
bge-m3
BGE-M3 是 BAAI 的一個新模型,以其在多功能性、多語言性和多粒度方面的多功能性而著稱。
嵌入 567m288.6K 下載次數 3 標籤 更新於 6 個月前
-
all-minilm
在非常大的句子級別資料集上的嵌入模型。
嵌入 22m 33m280.2K 下載次數 10 標籤 更新於 9 個月前
-
dolphin-llama3
Dolphin 2.9 是 Eric Hartford 基於 Llama 3 開發的一個新模型,尺寸有 8B 和 70B,具有各種指令、對話和程式碼編寫技能。
8b 70b277.1K 下載次數 53 標籤 更新於 8 個月前
-
command-r
Command R 是一個大型語言模型,針對對話互動和長上下文任務進行了最佳化。
工具 35b275K 下載次數 32 標籤 更新於 5 months ago
-
orca-mini
一個通用模型,參數範圍從 30 億到 700 億,適用於入門級硬體。
3b 7b 13b 70b268.3K 下載次數 119 標籤 更新於 15 months ago
-
llava-llama3
一個從 Llama 3 Instruct 微調而來的 LLaVA 模型,在多個基準測試中獲得更好的分數。
視覺 8b265.5K 下載次數 4 標籤 更新於 9 months ago
-
yi
Yi 1.5 是一個高效能的雙語語言模型。
6b 9b 34b261.2K 下載次數 174 標籤 更新於 8 months ago
-
hermes3
Hermes 3 是 Nous Research 旗艦 Hermes 系列 LLM 的最新版本
工具 3b 8b 70b 405b249.8K 下載次數 65 標籤 更新於 7 weeks ago
-
zephyr
Zephyr 是 Mistral 和 Mixtral 模型的一系列微調版本,經過訓練可以作為有用的助手。
7b 141b233.2K 下載次數 40 標籤 更新於 9 months ago
-
phi3.5
一款輕量級 AI 模型,具有 38 億個參數,其效能超越了相似和更大尺寸的模型。
3.8b229.9K 下載次數 17 標籤 更新於 5 months ago
-
codestral
Codestral 是 Mistral AI 首款專為程式碼生成任務設計的程式碼模型。
22b205K 下載次數 17 標籤 更新於 5 months ago
-
starcoder
StarCoder 是一個在 80 多種程式語言上訓練的程式碼生成模型。
1b 3b 7b 15b181.4K 下載次數 100 標籤 更新於 15 months ago
-
granite-code
IBM 為程式碼智慧開發的一系列開放基礎模型
3b 8b 20b 34b181.2K 下載次數 162 標籤 更新於 5 months ago
-
vicuna
基於 Llama 和 Llama 2 的通用聊天模型,具有 2K 到 16K 的上下文大小。
7b 13b 33b172.5K 下載次數 111 標籤 更新於 15 months ago
-
wizard-vicuna-uncensored
Wizard Vicuna Uncensored 是一個 7B、13B 和 30B 參數模型,基於 Eric Hartford 未審查的 Llama 2。
7b 13b 30b171.6K 下載次數 49 標籤 更新於 15 months ago
-
smollm
🪐 一系列小型模型,具有 135M、360M 和 1.7B 參數,在新高品質資料集上訓練。
135m 360m 1.7b169K 下載次數 94 標籤 更新於 5 months ago
-
mistral-openorca
Mistral OpenOrca 是一個 70 億參數模型,在 Mistral 7B 模型之上使用 OpenOrca 資料集進行了微調。
7b164.8K 下載次數 17 標籤 更新於 16 months ago
-
deepseek-v3
一個強大的專家混合 (MoE) 語言模型,總共有 671B 個參數,每個 token 啟用了 37B 個參數。
671b159.4K 下載次數 5 標籤 更新於 3 weeks ago
-
qwq
QwQ 是一個實驗性研究模型,專注於提升 AI 推理能力。
工具 32b153.9K 下載次數 5 標籤 更新於 2 months ago
-
smollm2
SmolLM2 是一系列精巧的語言模型,提供三種尺寸:135M、360M 和 1.7B 參數。
工具 135m 360m 1.7b153.7K 下載次數 49 標籤 更新於 3 months ago
-
llama2-chinese
基於 Llama 2 的模型,經過微調以提高中文對話能力。
7b 13b146K 下載次數 35 標籤 更新於 15 months ago
-
openchat
一系列在各種數據上訓練的開源模型,在各種基準測試中超越了 ChatGPT。已更新至 3.5-0106 版本。
7b136.6K 下載次數 50 標籤 更新於 13 months ago
-
codegeex4
適用於 AI 軟體開發場景的多功能模型,包括程式碼完成。
9b133.8K 下載次數 17 標籤 更新於 7 months ago
-
aya
Cohere 發布的 Aya 23 是一個新的最先進多語言模型系列,支持 23 種語言。
8b 35b130.9K 下載次數 33 標籤 更新於 8 months ago
-
codeqwen
CodeQwen1.5 是一個在大量程式碼資料上預訓練的大型語言模型。
7b126.4K 下載次數 30 標籤 更新於 7 個月前
-
nous-hermes2
Nous Research 強大的模型系列,擅長科學討論和編碼任務。
10.7b 34b120.2K 下載次數 33 標籤 更新於 13 個月前
-
mistral-large
Mistral Large 2 是 Mistral 全新的旗艦模型,在程式碼生成、數學和推理方面能力顯著提升,具備 128k 上下文窗口,並支援數十種語言。
工具 123b119K 下載次數 32 標籤 更新於 2 個月前
-
stable-code
Stable Code 3B 是一個編碼模型,具有指令和程式碼完成變體,與 Code Llama 7B 等模型相當,但體積小了 2.5 倍。
3b117K 下載次數 36 標籤 更新於 10 個月前
-
openhermes
OpenHermes 2.5 是一個 7B 模型,由 Teknium 在 Mistral 上進行微調,使用完全開放的資料集。
117K 下載次數 35 標籤 更新於 13 個月前
-
command-r-plus
Command R+ 是一個強大、可擴展的大型語言模型,專為在真實世界的企業用例中表現出色而打造。
工具 104b116.9K 下載次數 21 標籤 更新於 5 個月前
-
deepseek-llm
一個使用 2 兆雙語 tokens 打造的先進語言模型。
7b 67b116.6K 下載次數 64 標籤 更新於 14 個月前
-
tinydolphin
一個實驗性的 1.1B 參數模型,由 Eric Hartford 基於 TinyLlama,使用新的 Dolphin 2.8 資料集訓練而成。
1.1b115.5K 下載次數 18 標籤 更新於 12 個月前
-
glm4
一個強大的多語言通用語言模型,性能可與 Llama 3 媲美。
9b115.3K 下載次數 32 標籤 更新於 7 個月前
-
qwen2-math
Qwen2 Math 是一系列基於 Qwen2 LLM 建構的專業數學語言模型,其數學能力顯著優於開源模型,甚至閉源模型(例如 GPT4o)。
1.5b 7b 72b114.4K 下載次數 52 標籤 更新於 5 個月前
-
wizardcoder
最先進的程式碼生成模型
33b114.3K 下載次數 67 標籤 更新於 13 個月前
-
bakllava
BakLLaVA 是一個多模態模型,由 Mistral 7B 基礎模型和 LLaVA 架構組成。
視覺 7b105.6K 下載次數 17 標籤 更新於 13 個月前
-
stablelm2
Stable LM 2 是一個最先進的 1.6B 和 12B 參數語言模型,使用包含英語、西班牙語、德語、義大利語、法語、葡萄牙語和荷蘭語的多語言資料進行訓練。
1.6b 12b105.1K 下載次數 84 標籤 更新於 9 個月前
-
minicpm-v
一系列為視覺-語言理解設計的多模態 LLM (MLLM)。
視覺 8b102.5K 下載次數 17 標籤 更新於 2 個月前
-
reflection
一個高性能模型,使用一種名為「Reflection-tuning」的新技術進行訓練,該技術教導 LLM 偵測其推理中的錯誤並糾正方向。
70b102.1K 下載次數 17 標籤 更新於 4 個月前
-
deepseek-v2
一個強大、經濟高效且高效的專家混合語言模型。
16b 236b102K 下載次數 34 標籤 更新於 7 個月前
-
moondream
moondream2 是一個小型的視覺語言模型,旨在在邊緣設備上高效運行。
視覺 1.8b100.8K 下載次數 18 標籤 更新於 9 個月前
-
neural-chat
一個基於 Mistral 微調的模型,在領域和語言方面具有良好的覆蓋範圍。
7b99.6K 下載次數 50 標籤 更新於 13 個月前
-
mistral-small
Mistral Small 3 在 70B 以下的「小型」大型語言模型類別中,樹立了新的基準。
工具 22b 24b96.5K 下載次數 21 標籤 更新於 4 天前
-
llama3-gradient
此模型將 LLama-3 8B 的上下文長度從 8k 擴展到超過 1m tokens。
8b 70b96.1K 下載次數 35 標籤 更新於 9 個月前
-
wizard-math
專注於數學和邏輯問題的模型
7b 13b 70b96K 下載次數 64 標籤 更新於 13 個月前
-
llama3-chatqa
NVIDIA 基於 Llama 3 的模型,擅長對話式問答 (QA) 和檢索增強生成 (RAG)。
8b 70b88.3K 下載次數 35 標籤 更新於 8 個月前
-
sqlcoder
SQLCoder 是一個程式碼完成模型,基於 StarCoder 微調,用於 SQL 生成任務
7b 15b86.9K 下載次數 48 標籤 更新於 12 months ago
-
xwinlm
基於 Llama 2 的對話模型,在各種基準測試中表現出色。
7b 13b83.2K 下載次數 80 標籤 更新於 15 months ago
-
dolphincoder
Dolphin 模型系列的 7B 和 15B 無審查變體,基於 StarCoder2,擅長程式碼編寫。
7b 15b81K 下載次數 35 標籤 更新於 10 months ago
-
nous-hermes
Nous Research 基於 Llama 和 Llama 2 的通用模型。
7b 13b80.9K 下載次數 63 標籤 更新於 15 months ago
-
phind-codellama
基於 Code Llama 的程式碼生成模型。
34b80K 下載次數 49 標籤 更新於 13 months ago
-
yarn-llama2
Llama 2 的擴展,支援高達 128k tokens 的上下文。
7b 13b77.7K 下載次數 67 標籤 更新於 15 months ago
-
solar
一個精巧而強大的 10.7B 大型語言模型,專為單輪對話設計。
10.7b76.2K 下載次數 32 標籤 更新於 13 months ago
-
starling-lm
Starling 是一個大型語言模型,透過來自 AI 回饋的強化學習進行訓練,專注於提升聊天機器人的實用性。
7b75.5K 下載次數 36 標籤 更新於 10 months ago
-
wizardlm
基於 Llama 2 的通用模型。
75.4K 下載次數 73 標籤 更新於 15 months ago
-
llava-phi3
一個基於 Phi 3 Mini 微調的新型小型 LLaVA 模型。
視覺 3.8b72.9K 下載次數 4 標籤 更新於 9 months ago
-
yi-coder
Yi-Coder 是一系列開源程式碼語言模型,以少於 100 億參數提供最先進的程式碼編寫性能。
1.5b 9b72.8K 下載次數 67 標籤 更新於 4 months ago
-
athene-v2
Athene-V2 是一個 72B 參數模型,擅長程式碼完成、數學和日誌提取任務。
工具 72b70K 下載次數 17 標籤 更新於 2 months ago
-
internlm2
InternLM2.5 是一個 7B 參數模型,專為實際場景量身定制,具有出色的推理能力。
1m 1.8b 7b 20b70K 下載次數 65 標籤 更新於 5 months ago
-
falcon
由 Technology Innovation Institute (TII) 建構的大型語言模型,用於摘要、文本生成和聊天機器人。
7b 40b 180b67.2K 下載次數 38 標籤 更新於 15 months ago
-
samantha-mistral
一個在哲學、心理學和人際關係方面訓練的伴侶助理。基於 Mistral。
7b67.1K 下載次數 49 標籤 更新於 15 months ago
-
orca2
Orca 2 由 Microsoft research 建構,是 Meta 的 Llama 2 模型微調版本。該模型旨在特別擅長推理。
7b 13b61.2K 下載次數 33 標籤 更新於 14 months ago
-
nemotron
Llama-3.1-Nemotron-70B-Instruct 是一個由 NVIDIA 客製化的大型語言模型,旨在提升 LLM 生成的回應用戶查詢的實用性。
工具 70b60.7K 下載次數 17 標籤 更新於 3 months ago
-
nemotron-mini
NVIDIA 的商業友好型小型語言模型,針對角色扮演、RAG QA 和函數調用進行了優化。
工具 4b59.3K 下載次數 17 標籤 更新於 4 months ago
-
dolphin-phi
Eric Hartford 的 2.7B 無審查 Dolphin 模型,基於 Microsoft Research 的 Phi 語言模型。
2.7b59.2K 下載次數 15 標籤 更新於 13 months ago
-
stable-beluga
基於 Llama 2 的模型,在 Orca 風格的數據集上進行微調。原名 Free Willy。
7b 13b 70b58.1K 下載次數 49 標籤 更新於 15 個月前
-
wizardlm-uncensored
Wizard LM 模型的未經審查版本
13b57.5K 下載次數 18 標籤 更新於 15 個月前
-
dolphin3
Dolphin 3.0 Llama 3.1 8B 🐬 是下一代 Dolphin 系列的指令微調模型,旨在成為終極通用本地模型,可實現編碼、數學、代理、函數呼叫和一般用例。
8b55.5K 下載次數 5 標籤 更新於 4 週前
-
llama3-groq-tool-use
Groq 公司推出的一系列模型,代表了開源 AI 在工具使用/函數呼叫能力方面的重大進展。
工具 8b 70b46.8K 下載次數 33 標籤 更新於 6 個月前
-
granite3.1-dense
IBM Granite 2B 和 8B 模型是純文本密集型 LLM,使用超過 12 兆個 token 的數據進行訓練,在 IBM 的初步測試中,在性能和速度方面都展現出比其前代產品顯著的改進。
工具 2b 8b46.3K 下載次數 33 標籤 更新於 2 週前
-
granite3-dense
IBM Granite 2B 和 8B 模型旨在支持基於工具的用例以及檢索增強生成 (RAG),從而簡化程式碼生成、翻譯和錯誤修復。
工具 2b 8b45.5K 下載次數 33 標籤 更新於 2 個月前
-
medllama2
基於開源醫學數據集,對 Llama 2 模型進行微調,以回答醫療問題。
7b44.9K 下載次數 17 標籤 更新於 15 個月前
-
llama-pro
Llama 2 的擴展版本,專門整合通用語言理解和領域特定知識,尤其是在程式設計和數學方面。
44.6K 下載次數 33 標籤 更新於 13 個月前
-
yarn-mistral
Mistral 的擴展版本,用於支持 64K 或 128K 的上下文窗口。
7b44.5K 下載次數 33 標籤 更新於 15 個月前
-
meditron
基於 Llama 2 改編的開源醫學大型語言模型,適用於醫療領域。
7b 70b44.2K 下載次數 22 標籤 更新於 14 個月前
-
nexusraven
Nexus Raven 是一個 13B 的指令微調模型,用於函數呼叫任務。
13b40.8K 下載次數 32 標籤 更新於 12 個月前
-
nous-hermes2-mixtral
Nous Research 的 Nous Hermes 2 模型,現在基於 Mixtral 進行訓練。
8x7b37.4K 下載次數 18 標籤 更新於 6 週前
-
smallthinker
一個新的小型推理模型,從 Qwen 2.5 3B Instruct 模型微調而來。
3b37.1K 下載次數 5 標籤 更新於 5 週前
-
codeup
基於 Llama2 的出色程式碼生成模型。
13b36.2K 下載次數 19 標籤 更新於 15 個月前
-
everythinglm
基於 Llama2 的未經審查模型,支持 16K 上下文窗口。
13b35.6K 下載次數 18 標籤 更新於 13 個月前
-
granite3-moe
IBM Granite 1B 和 3B 模型是 IBM 推出的首批混合專家 (MoE) Granite 模型,專為低延遲使用而設計。
工具 1b 3b34.5K 下載次數 33 標籤 更新於 2 個月前
-
aya-expanse
Cohere For AI 的語言模型,經過訓練,可在 23 種不同的語言中表現良好。
工具 8b 32b33K 下載次數 33 標籤 更新於 3 個月前
-
magicoder
🎩 Magicoder 是一個 7B 參數模型系列,使用 OSS-Instruct 在 75K 合成指令數據上進行訓練,OSS-Instruct 是一種通過開源程式碼片段啟發 LLM 的新穎方法。
7b31.3K 下載次數 18 標籤 更新於 14 個月前
-
falcon2
Falcon2 是一個 11B 參數的因果解碼器專用模型,由 TII 構建,並使用超過 5T 個 token 進行訓練。
11b31.1K 下載次數 17 標籤 更新於 8 個月前
-
stablelm-zephyr
一個輕量級聊天模型,無需高端硬件即可實現準確且響應迅速的輸出。
3b30.7K 下載次數 17 標籤 更新於 13 個月前
-
codebooga
通過合併兩個現有的程式碼模型而創建的高性能程式碼指令模型。
34b30.4K 下載次數 16 標籤 更新於 15 個月前
-
bge-large
BAAI 的嵌入模型,將文本映射到向量。
嵌入 335m30.3K 提取次數 3 標籤 更新於 6 個月前
-
mathstral
MathΣtral:由 Mistral AI 設計的 7B 模型,專為數學推理和科學發現而打造。
7b29.9K 提取次數 17 標籤 更新於 6 個月前
-
olmo2
OLMo 2 是一個新的 7B 和 13B 模型系列,最多使用 5T 個 tokens 進行訓練。這些模型與同等大小的完全開放模型效能相當或更佳,並且在英文學術基準測試中,與 Llama 3.1 等開放權重模型競爭力十足。
7b 13b29K 提取次數 9 標籤 更新於 3 週前
-
mistrallite
MistralLite 是一個基於 Mistral 微調的模型,具有增強的長上下文處理能力。
7b28.9K 提取次數 17 標籤 更新於 15 個月前
-
wizard-vicuna
Wizard Vicuna 是一個基於 Llama 2 的 13B 參數模型,由 MelodysDreamj 訓練。
13b28.9K 提取次數 17 標籤 更新於 15 個月前
-
reader-lm
一系列將 HTML 內容轉換為 Markdown 內容的模型,適用於內容轉換任務。
0.5b 1.5b28.7K 提取次數 33 標籤 更新於 4 個月前
-
duckdb-nsql
由 MotherDuck 和 Numbers Station 製作的 7B 參數文字轉 SQL 模型。
7b28.5K 提取次數 17 標籤 更新於 12 個月前
-
falcon3
一系列低於 10B 參數的高效能 AI 模型,透過創新的訓練技術,在科學、數學和編碼方面表現出色。
1b 3b 7b 10b28.4K 提取次數 17 標籤 更新於 6 週前
-
marco-o1
阿里巴巴國際數位商業集團 (AIDC-AI) 開發的開放大型推理模型,適用於真實世界的解決方案。
7b28K 提取次數 5 標籤 更新於 2 個月前
-
solar-pro
Solar Pro Preview:一個先進的大型語言模型 (LLM),具有 220 億個參數,旨在適用於單一 GPU。
22b27.4K 提取次數 18 標籤 更新於 4 個月前
-
megadolphin
MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的轉換版本,透過將模型與自身交錯而成。
120b24.8K 提取次數 19 標籤 更新於 13 個月前
-
notux
一個頂尖效能的專家混合模型,使用高品質資料進行微調。
8x7b23.8K 提取次數 18 標籤 更新於 13 個月前
-
shieldgemma
ShieldGemma 是一系列指令微調模型,用於評估文本提示輸入和文本輸出回應,以對照一組定義的安全策略。
2b 9b 27b23.3K 提取次數 49 標籤 更新於 3 個月前
-
open-orca-platypus2
Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合併版本。專為聊天和程式碼生成而設計。
13b23.2K 提取次數 17 標籤 更新於 15 個月前
-
notus
Notus 是一個 7B 聊天模型,使用高品質資料進行微調,並基於 Zephyr。
7b23.1K 提取次數 18 標籤 更新於 13 個月前
-
goliath
一個透過將兩個微調過的 Llama 2 70B 模型合併為一而建立的語言模型。
22.7K 提取次數 16 標籤 更新於 14 個月前
-
llama-guard3
Llama Guard 3 是一系列模型,經過微調,用於對 LLM 輸入和回應的內容安全分類。
1b 8b21.6K 提取次數 33 標籤 更新於 3 個月前
-
bespoke-minicheck
由 Bespoke Labs 開發的最先進的事實查核模型。
7b21K 提取次數 17 標籤 更新於 4 個月前
-
granite3.1-moe
IBM Granite 1B 和 3B 模型是由 IBM 開發的長上下文專家混合 (MoE) Granite 模型,專為低延遲使用而設計。
工具 1b 3b20.6K 提取次數 33 標籤 更新於 2 週前
-
nuextract
一個基於 Phi-3,並在私人高品質合成資料集上微調的 3.8B 模型,用於資訊提取。
3.8b20.1K 提取次數 17 標籤 更新於 6 個月前
-
opencoder
OpenCoder 是一個開放且可重現的程式碼 LLM 系列,包含 1.5B 和 8B 模型,支援英文和中文語言的聊天。
1.5b 8b20K 提取次數 9 標籤 更新於 2 個月前
-
snowflake-arctic-embed2
Snowflake 的前沿嵌入模型。Arctic Embed 2.0 新增了多語言支援,同時不犧牲英文效能或可擴展性。
嵌入 568m19.2K 提取次數 3 標籤 更新於 2 個月前
-
deepseek-v2.5
DeepSeek-V2.5 的升級版本,整合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和編碼能力。
236b18.6K 提取次數 7 標籤 更新於 4 個月前
-
firefunction-v2
一個基於 Llama 3 的開放權重函數呼叫模型,在函數呼叫能力上可與 GPT-4o 媲美。
工具 70b17.9K 提取次數 17 標籤 更新於 6 個月前
-
dbrx
DBRX 是一個由 Databricks 建立的開放通用 LLM。
132b17.6K 下載次數 7 標籤 更新於 9 months ago
-
exaone3.5
EXAONE 3.5 是由 LG AI Research 開發和發布的一系列指令微調雙語(英語和韓語)生成模型,參數範圍從 2.4B 到 32B。
2.4b 7.8b 32b17.5K 下載次數 13 標籤 更新於 8 weeks ago
-
paraphrase-multilingual
Sentence-transformers 模型,可用於諸如集群或語義搜索等任務。
embedding 278m17.2K 下載次數 3 標籤 更新於 6 months ago
-
alfred
一個穩健的對話模型,旨在用於聊天和指令用例。
40b14.9K 下載次數 7 標籤 更新於 14 months ago
-
command-r7b
Cohere R 系列中最小的模型,提供頂級的速度、效率和質量,以在通用 GPU 和邊緣設備上構建強大的 AI 應用程式。
工具 7b13.7K 下載次數 5 標籤 更新於 2 weeks ago
-
tulu3
Tülu 3 是一個領先的指令跟隨模型系列,由 The Allen Institute for AI 提供完全開源的數據、代碼和配方。
8b 70b13.7K 下載次數 9 標籤 更新於 6 weeks ago
-
granite3-guardian
IBM Granite Guardian 3.0 2B 和 8B 模型旨在檢測提示和/或回應中的風險。
2b 8b13.6K 下載次數 10 標籤 更新於 2 months ago
-
granite-embedding
IBM Granite Embedding 30M 和 278M 模型是純文本密集雙編碼器嵌入模型,其中 30M 僅提供英語版本,而 278M 則服務於多語言用例。
embedding 30m 278m11.3K 下載次數 6 標籤 更新於 6 weeks ago
-
sailor2
Sailor2 是為東南亞製作的多語言語言模型。提供 1B、8B 和 20B 參數大小。
1b 8b 20b5,526 下載次數 13 標籤 更新於 2 months ago