目前最強大且適用於單一 GPU 的模型。
89.7K 下載次數 9 標籤 更新於 21 小時前
QwQ 是 Qwen 系列的推理模型。
880.1K 下載次數 8 標籤 更新於 7 天前
DeepSeek 第一代推理模型,效能與 OpenAI-o1 相近,包含六個從 DeepSeek-R1 基於 Llama 和 Qwen 提煉出的密集模型。
25.8M 下載次數 29 標籤 更新於 4 週前
最新的 70B 模型。Llama 3.3 70B 提供與 Llama 3.1 405B 模型相近的效能。
1.5M 下載次數 14 標籤 更新於 3 個月前
Phi-4 是微軟推出的最先進 14B 參數開放模型。
1M 下載次數 5 標籤 更新於 2 個月前
Meta 的 Llama 3.2 以 1B 和 3B 模型走向小型化。
10.5M 下載次數 63 標籤 更新於 5 個月前
Llama 3.1 是 Meta 推出的最新最先進模型,提供 8B、70B 和 405B 參數大小。
26.7M 下載次數 93 標籤 更新於 3 個月前
高效能的開放嵌入模型,具有大型 token 上下文視窗。
18.8M 下載次數 3 標籤 更新於 12 個月前
Mistral AI 發布的 7B 模型,已更新至 0.3 版本。
10.2M 下載次數 84 標籤 更新於 7 個月前
Meta Llama 3:至今功能最強大的公開 LLM
7.6M 下載次數 68 標籤 更新於 9 個月前
Qwen2.5 模型在阿里巴巴最新的大規模資料集上進行預訓練,包含高達 18 兆個 token。該模型支援高達 128K 個 token,並具有多語言支援。
5.2M 下載次數 133 標籤 更新於 5 個月前
最新的程式碼專用 Qwen 模型系列,在程式碼生成、程式碼推理和程式碼修復方面有顯著改進。
4.6M 下載次數 196 標籤 更新於 4 個月前
Qwen 1.5 是阿里巴巴雲端推出的一系列大型語言模型,參數規模從 0.5B 到 110B
4.5M 下載次數 379 標籤 更新於 10 個月前
Gemma 是 Google DeepMind 打造的輕量級、最先進開放模型系列。已更新至 1.1 版本
4.4M 下載次數 102 標籤 更新於 11 個月前
Qwen2 是阿里巴巴集團推出的新系列大型語言模型
4.1M 提取次數 97 標籤 更新於 6 個月前
🌋 LLaVA 是一個新穎的端到端訓練大型多模態模型,結合了視覺編碼器和 Vicuna,用於通用視覺和語言理解。已更新至 1.6 版本。
4M 提取次數 98 標籤 更新於 13 個月前
Google Gemma 2 是一個高效能且有效率的模型,提供三種尺寸:2B、9B 和 27B。
3.4M 提取次數 94 標籤 更新於 7 個月前
Llama 2 是一系列基礎語言模型,參數範圍從 7B 到 70B。
3.1M 提取次數 102 標籤 更新於 14 個月前
Phi-3 是微軟推出的一系列最先進的輕量級開放模型,包含 3B (Mini) 和 14B (Medium) 兩種尺寸。
2.9M 提取次數 72 標籤 更新於 7 個月前
一個大型語言模型,可以使用文字提示來產生和討論程式碼。
1.8M 提取次數 199 標籤 更新於 7 個月前
來自 mixedbread.ai 的最先進大型嵌入模型
1.8M 提取次數 4 標籤 更新於 10 個月前
Llama 3.2 Vision 是一系列指令微調的圖像推理生成模型,具有 11B 和 90B 兩種尺寸。
1.5M 提取次數 9 標籤 更新於 4 個月前
TinyLlama 專案是一個開放的努力,旨在用 3 兆個 tokens 訓練一個精巧的 1.1B Llama 模型。
1.3M 提取次數 36 標籤 更新於 14 個月前
Mistral AI 與 NVIDIA 合作建構的最先進 12B 模型,具有 128k 上下文長度。
1.3M 提取次數 17 標籤 更新於 7 個月前
StarCoder2 是下一代透明訓練的開放程式碼 LLM,提供三種尺寸:3B、7B 和 15B 參數。
898K 提取次數 67 標籤 更新於 6 個月前
一個強大的專家混合 (MoE) 語言模型,總共有 671B 個參數,每個 token 啟用 37B 個參數。
750.1K 提取次數 5 標籤 更新於 8 週前
George Sung 和 Jarrad Hope 開發的未經審查 Llama 2 模型。
732.8K 提取次數 34 標籤 更新於 16 個月前
一個開源的專家混合程式碼語言模型,在程式碼特定任務中實現了與 GPT4-Turbo 相媲美的效能。
723.4K 提取次數 64 標籤 更新於 6 個月前
Snowflake 的一系列文字嵌入模型,針對效能進行了最佳化。
697.9K 提取次數 16 標籤 更新於 11 個月前
DeepSeek Coder 是一個功能強大的程式碼模型,使用兩兆個程式碼和自然語言 tokens 進行訓練。
602.6K 提取次數 102 標籤 更新於 14 個月前
Mistral AI 開發的一組具有開放權重的專家混合 (MoE) 模型,尺寸為 8x7b 和 8x22b 參數。
583.5K 提取次數 70 標籤 更新於 2 個月前
BGE-M3 是 BAAI 的新型號,以其在多功能性、多語言性和多粒度方面的多樣性而著稱。
563.2K 提取次數 3 標籤 更新於 7 個月前
一系列多模態 LLM (MLLM),專為視覺語言理解而設計。
547.2K 提取次數 17 標籤 更新於 3 個月前
CodeGemma 是一系列強大、輕量型的模型,可以執行各種程式碼任務,例如填空中程式碼完成、程式碼生成、自然語言理解、數學推理和指令遵循。
532.1K 下載次數 85 標籤 更新於 7 個月前
無審查,基於 Mixtral 專家混合模型微調的 8x7b 和 8x22b 模型,擅長編碼任務。由 Eric Hartford 創建。
522.7K 下載次數 70 標籤 更新於 2 個月前
一個完全開源的推理模型系列,使用從 DeepSeek-R1 提煉出的數據集構建。
510.1K 下載次數 9 標籤 更新於 4 週前
Phi-2:微軟研究院的 2.7B 語言模型,展示了出色的推理和語言理解能力。
497.3K 下載次數 18 標籤 更新於 14 個月前
一個從 Llama 3 Instruct 微調而來的 LLaVA 模型,在多個基準測試中獲得更好的分數。
453.7K 下載次數 4 標籤 更新於 10 個月前
Dolphin 3.0 Llama 3.1 8B 🐬 是下一代 Dolphin 系列指令微調模型,旨在成為終極通用本地模型,支援編碼、數學、代理、函數呼叫和一般用例。
397.4K 下載次數 5 標籤 更新於 2 個月前
SmolLM2 是一個緊湊型語言模型系列,提供三種尺寸:135M、360M 和 1.7B 參數。
376.4K 下載次數 49 標籤 更新於 4 個月前
OLMo 2 是一個新的 7B 和 13B 模型系列,使用高達 5T 的 tokens 訓練。這些模型與同等大小的完全開放模型性能相當或更好,並且在英語學術基準測試中與 Llama 3.1 等開放權重模型競爭。
362.9K 下載次數 9 標籤 更新於 2 個月前
來自微軟 AI 的最先進大型語言模型,在複雜的聊天、多語言、推理和代理用例方面具有改進的性能。
357.1K 下載次數 22 標籤 更新於 11 個月前
基於 Mistral 的無審查 Dolphin 模型,擅長編碼任務。已更新至 2.8 版本。
326.1K 下載次數 120 標籤 更新於 11 個月前
非常大的句子級數據集上的嵌入模型。
312.2K 下載次數 10 標籤 更新於 10 個月前
Mistral Small 3 在 70B 以下的「小型」大型語言模型類別中樹立了新的基準。
303.6K 下載次數 21 標籤 更新於 5 週前
Dolphin 2.9 是 Eric Hartford 基於 Llama 3 開發的新模型,具有 8B 和 70B 兩種尺寸,並具備多種指令、對話和編碼技能。
293.9K 下載次數 53 標籤 更新於 10 個月前
Command R 是一個為對話互動和長上下文任務優化的大型語言模型。
283.3K 下載次數 32 標籤 更新於 6 個月前
一個通用模型,參數範圍從 30 億到 700 億,適用於入門級硬體。
277.4K 下載次數 119 標籤 更新於 16 個月前
Yi 1.5 是一個高性能的雙語語言模型。
267.4K 下載次數 174 標籤 更新於 10 個月前
Hermes 3 是 Nous Research 旗艦 Hermes 系列 LLM 的最新版本。
265K 下載次數 65 標籤 更新於 2 個月前
一個輕量級 AI 模型,具有 38 億參數,性能超越了類似和更大尺寸的模型。
250.3K 下載次數 17 標籤 更新於 6 個月前
Zephyr 是 Mistral 和 Mixtral 模型的一系列微調版本,經過訓練可以作為有用的助手。
238.4K 下載次數 40 標籤 更新於 11 個月前
Codestral 是 Mistral AI 首個專為程式碼生成任務設計的程式碼模型。
228.4K 下載次數 17 標籤 已更新 6 個月前
IBM 為程式碼智慧開發的開放基礎模型系列
191.8K 下載次數 162 標籤 已更新 6 個月前
🪐 一系列小型模型,參數規模包含 135M、360M 和 1.7B,並以全新的高品質資料集訓練。
189.1K 下載次數 94 標籤 已更新 6 個月前
StarCoder 是一個程式碼生成模型,以 80 多種程式語言進行訓練。
187.8K 下載次數 100 標籤 已更新 16 個月前
Wizard Vicuna Uncensored 是一個基於 Eric Hartford 的 Llama 2 Uncensored 模型,參數規模包含 7B、13B 和 30B。
186K 下載次數 49 標籤 已更新 16 個月前
基於 Llama 和 Llama 2 的通用聊天模型,上下文大小為 2K 至 16K。
176.3K 下載次數 111 標籤 已更新 16 個月前
Mistral OpenOrca 是一個 70 億參數的模型,基於 Mistral 7B 模型,並使用 OpenOrca 資料集進行微調。
167.1K 下載次數 17 標籤 已更新 17 個月前
基於 Llama 2 的模型,經過微調以提升中文對話能力。
150K 下載次數 35 標籤 已更新 16 個月前
一系列基於多種資料訓練的開源模型,在多項基準測試中超越 ChatGPT。已更新至 3.5-0106 版本。
145.6K 下載次數 50 標籤 已更新 14 個月前
一個適用於 AI 軟體開發場景的多功能模型,包含程式碼自動完成功能。
139.3K 下載次數 17 標籤 已更新 8 個月前
由 Cohere 發布的 Aya 23 是一個全新的最先進多語言模型系列,支援 23 種語言。
136.5K 下載次數 33 標籤 已更新 9 個月前
CodeQwen1.5 是一個大型語言模型,預訓練於大量的程式碼資料。
135K 下載次數 30 標籤 已更新 8 個月前
一個以 2 兆雙語 tokens 精心打造的先進語言模型。
132.2K 下載次數 64 標籤 已更新 15 個月前
一個強大、經濟且高效的專家混合語言模型。
128.6K 下載次數 34 標籤 已更新 8 個月前
Mistral Large 2 是 Mistral 全新的旗艦模型,在程式碼生成、數學和推理方面能力顯著提升,具有 128k 上下文窗口並支援數十種語言。
125.3K 下載次數 32 標籤 已更新 3 個月前
一個強大的多語言通用語言模型,性能可與 Llama 3 媲美。
123.6K 下載次數 32 標籤 已更新 8 個月前
Stable Code 3B 是一個程式碼模型,具有指令和程式碼自動完成變體,性能與 Code Llama 7B 等模型相當,但模型規模縮小了 2.5 倍。
122.4K 下載次數 36 標籤 已更新 11 個月前
OpenHermes 2.5 是一個由 Teknium 在 Mistral 上使用完全開放資料集微調的 7B 模型。
122.1K 下載次數 35 標籤 已更新 14 個月前
Nous Research 強大的模型系列,擅長科學討論和程式碼編寫任務。
121.9K 下載次數 33 標籤 已更新 14 個月前
Qwen2 Math 是一系列基於 Qwen2 LLMs 建構的專業數學語言模型,其數學能力顯著優於開源模型,甚至閉源模型 (例如 GPT4o)。
120.7K 下載次數 52 標籤 已更新 6 個月前
一個實驗性的 1.1B 參數模型,由 Eric Hartford 基於 TinyLlama 並使用全新的 Dolphin 2.8 資料集訓練而成。
120.6K 下載次數 18 標籤 更新於 13 個月前
Command R+ 是一個強大、可擴展的大型語言模型,專為在真實世界的企業用例中表現出色而設計。
119.7K 下載次數 21 標籤 更新於 6 個月前
moondream2 是一個小型視覺語言模型,旨在邊緣設備上高效運行。
119.5K 下載次數 18 標籤 更新於 10 個月前
最先進的程式碼生成模型
117.3K 下載次數 67 標籤 更新於 14 個月前
BakLLaVA 是一個多模態模型,由 Mistral 7B 基礎模型以 LLaVA 架構擴增而成。
109.9K 下載次數 17 標籤 更新於 15 個月前
Stable LM 2 是一個最先進的 1.6B 和 12B 參數語言模型,以英語、西班牙語、德語、義大利語、法語、葡萄牙語和荷蘭語的多語言資料進行訓練。
108.2K 下載次數 84 標籤 更新於 10 個月前
一個基於 Mistral 微調的模型,在領域和語言方面有良好的覆蓋範圍。
104.8K 下載次數 50 標籤 更新於 14 個月前
一個高效能模型,以一種稱為「Reflection-tuning」的新技術訓練,該技術教導大型語言模型偵測其推理中的錯誤並修正方向。
103.4K 下載次數 17 標籤 更新於 6 個月前
專注於數學和邏輯問題的模型
101.2K 下載次數 64 標籤 更新於 14 個月前
此模型將 LLama-3 8B 的上下文長度從 8k 擴展到超過 100 萬個 tokens。
98.1K 下載次數 35 標籤 更新於 10 個月前
NVIDIA 基於 Llama 3 的模型,擅長對話式問答 (QA) 和檢索增強生成 (RAG)。
97.2K 下載次數 35 標籤 更新於 10 個月前
SQLCoder 是一個程式碼自動完成模型,在 StarCoder 上針對 SQL 生成任務進行了微調
94.4K 下載次數 48 標籤 更新於 13 個月前
一個在哲學、心理學和人際關係方面訓練的伴侶助理。基於 Mistral。
90.2K 下載次數 49 標籤 更新於 17 個月前
BAAI 的嵌入模型,將文本映射到向量。
89.9K 下載次數 3 標籤 更新於 7 個月前
基於 Llama 2 的對話模型,在各種基準測試中表現出競爭力。
84.4K 下載次數 80 標籤 更新於 16 個月前
Dolphin 模型系列的 7B 和 15B 未經審查的變體,基於 StarCoder2,擅長編碼。
84.2K 下載次數 35 標籤 更新於 11 個月前
來自 Nous Research 的基於 Llama 和 Llama 2 的通用模型。
82.4K 下載次數 63 標籤 更新於 16 個月前
IBM Granite 2B 和 8B 模型是純文本密集型大型語言模型,在超過 12 兆個 tokens 的資料上訓練,在 IBM 的初步測試中,與其前代產品相比,在性能和速度方面展現出顯著的改進。
82.1K 下載次數 33 標籤 更新於 7 週前
一個新的小型 LLaVA 模型,從 Phi 3 Mini 微調而來。
81.8K 下載次數 4 標籤 更新於 10 個月前
基於 Code Llama 的程式碼生成模型。
81.6K 下載次數 49 標籤 更新於 14 個月前
Starling 是一個大型語言模型,透過人工智慧回饋的強化學習訓練,專注於提高聊天機器人的實用性。
81.3K 下載次數 36 標籤 更新於 11 個月前
一個精巧而強大的 10.7B 大型語言模型,專為單輪對話設計。
79.1K 下載次數 32 標籤 更新於 15 個月前
Llama 2 的擴展,支援高達 128k tokens 的上下文。
78.9K 下載次數 67 標籤 更新於 16 個月前
Yi-Coder 是一系列開源程式碼語言模型,以少於 100 億參數的規模,提供最先進的程式碼編寫效能。
77.1K 下載次數 67 標籤 更新於 6 個月前
Athene-V2 是一個 720 億參數的模型,擅長程式碼自動完成、數學和日誌提取任務。
77K 下載次數 17 標籤 更新於 3 個月前
基於 Llama 2 的通用模型。
75.8K 下載次數 73 標籤 更新於 16 個月前
InternLM2.5 是一個 70 億參數的模型,專為實際應用場景設計,具有出色的推理能力。
74.1K 下載次數 65 標籤 更新於 6 個月前
一個由技術創新研究院 (TII) 建立的大型語言模型,用於摘要、文本生成和聊天機器人。
70.2K 下載次數 38 標籤 更新於 16 個月前
NVIDIA 出品,一個商業友善的小型語言模型,針對角色扮演、RAG QA 和函數呼叫進行了優化。
70.1K 下載次數 17 標籤 更新於 5 個月前
Llama-3.1-Nemotron-70B-Instruct 是一個由 NVIDIA 客製化的大型語言模型,旨在提高 LLM 生成的回應用戶查詢的實用性。
66.9K 下載次數 17 標籤 更新於 4 個月前
Deepseek-R1-Distilled-Qwen-1.5B 的微調版本,僅用 15 億參數,在熱門數學評估中超越了 OpenAI 的 o1-preview 的效能。
66.5K 下載次數 5 標籤 更新於 4 週前
Eric Hartford 基於 Microsoft Research 的 Phi 語言模型所打造的 27 億參數無審查 Dolphin 模型。
66K 下載次數 15 標籤 更新於 14 個月前
Orca 2 由微軟研究院開發,是 Meta Llama 2 模型的微調版本。該模型旨在特別擅長推理。
63.8K 下載次數 33 標籤 更新於 15 個月前
Wizard LM 模型的無審查版本。
60.9K 下載次數 18 標籤 更新於 16 個月前
基於 Llama 2 模型,並在 Orca 風格的資料集上進行微調。原名 Free Willy。
59K 下載次數 49 標籤 更新於 16 個月前
IBM Granite 2B 和 8B 模型旨在支援基於工具的使用案例,並支援檢索增強生成 (RAG),簡化程式碼生成、翻譯和錯誤修復。
58K 下載次數 33 標籤 更新於 3 個月前
Groq 出品的一系列模型,代表了開源 AI 在工具使用/函數呼叫能力方面的重大進展。
56.3K 下載次數 33 標籤 更新於 7 個月前
Sentence-transformers 模型,可用於叢集或語義搜尋等任務。
53.1K 下載次數 3 標籤 更新於 7 個月前
DeekSeek-V2 的升級版本,整合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和程式碼編寫能力。
50K 下載次數 7 標籤 更新於 6 個月前
一個從 Qwen 2.5 3B Instruct 模型微調而來的新型小型推理模型。
48.2K 下載次數 5 標籤 更新於 2 個月前
微調的 Llama 2 模型,基於開源醫療資料集回答醫療問題。
47.7K 下載次數 17 標籤 更新於 16 個月前
從 Llama 2 改編而來的開源醫療大型語言模型,適用於醫療領域。
47.7K 下載次數 22 標籤 更新於 15 個月前
Cohere For AI 的語言模型,經過訓練,在 23 種不同語言中表現出色。
46.8K 下載次數 33 標籤 更新於 4 個月前
Llama 2 的擴展版本,專門整合通用語言理解和領域特定知識,尤其是在程式設計和數學方面。
45.8K 提取次數 33 標籤 更新於 14 個月前
Mistral 的擴展,以支援 64K 或 128K 的上下文窗口。
45.2K 提取次數 33 標籤 更新於 16 個月前
IBM Granite 1B 和 3B 模型是 IBM 首個混合專家 (MoE) Granite 模型系列,專為低延遲使用而設計。
44.4K 提取次數 33 標籤 更新於 3 個月前
一個高效能 AI 模型系列,參數小於 10B,透過創新的訓練技術,在科學、數學和程式碼方面表現出色。
42.4K 提取次數 17 標籤 更新於 2 個月前
Nexus Raven 是一個 13B 指令微調模型,適用於函數呼叫任務。
41.7K 提取次數 32 標籤 更新於 14 個月前
基於 Llama2 的出色程式碼生成模型。
39.7K 提取次數 19 標籤 更新於 16 個月前
基於 Llama2 的未經審查模型,支援 16K 上下文窗口。
38.5K 提取次數 18 標籤 更新於 14 個月前
Nous Research 的 Nous Hermes 2 模型,現在基於 Mixtral 進行訓練。
38.4K 提取次數 18 標籤 更新於 2 個月前
Snowflake 的前沿嵌入模型。Arctic Embed 2.0 增加了多語言支援,且不犧牲英語效能或擴展性。
37.4K 提取次數 3 標籤 更新於 3 個月前
ShieldGemma 是一組指令微調模型,用於評估文本提示輸入和文本輸出回應針對一組已定義安全策略的安全性。
36.2K 提取次數 49 標籤 更新於 5 個月前
IBM Granite 1B 和 3B 模型是 IBM 的長上下文混合專家 (MoE) Granite 模型系列,專為低延遲使用而設計。
35.7K 提取次數 33 標籤 更新於 7 週前
阿里巴巴國際數位商業集團 (AIDC-AI) 為真實世界解決方案開發的開放大型推理模型。
33.3K 提取次數 5 標籤 更新於 3 個月前
Phi-4-mini 在多語言支援、推理和數學方面帶來了顯著的增強功能,現在終於支援期待已久的函數呼叫功能。
33.2K 提取次數 5 標籤 更新於 12 天前
MathΣtral:Mistral AI 設計的 7B 模型,專為數學推理和科學發現而設計。
32.8K 提取次數 17 標籤 更新於 7 個月前
一系列將 HTML 內容轉換為 Markdown 內容的模型,這對於內容轉換任務非常有用。
32.6K 提取次數 33 標籤 更新於 6 個月前
Falcon2 是由 TII 構建並在超過 5T 個 token 上訓練的 11B 參數因果解碼器模型。
32.4K 提取次數 17 標籤 更新於 10 個月前
🎩 Magicoder 是一個 7B 參數模型系列,使用 OSS-Instruct 在 75K 合成指令資料上進行訓練,OSS-Instruct 是一種透過開源程式碼片段啟發 LLM 的新穎方法。
32.2K 提取次數 18 標籤 更新於 15 個月前
一款輕量級聊天模型,無需高階硬體即可實現準確且反應靈敏的輸出。
32.1K 提取次數 17 標籤 更新於 14 個月前
Solar Pro Preview:一款具有 220 億參數的先進大型語言模型 (LLM),旨在適用於單個 GPU
32.1K 提取次數 18 標籤 更新於 5 個月前
透過合併兩個現有程式碼模型而建立的高效能程式碼指令模型。
31.4K 提取次數 16 標籤 更新於 16 個月前
Llama Guard 3 是一系列模型,經過微調,用於對 LLM 輸入和回應的內容安全進行分類。
30.7K 提取次數 33 標籤 更新於 5 個月前
由 MotherDuck 和 Numbers Station 製作的 7B 參數 text-to-SQL 模型。
30.5K 提取次數 17 標籤 更新於 13 個月前
MistralLite 是一個基於 Mistral 微調的模型,增強了處理長上下文的能力。
30.1K 提取次數 17 標籤 更新於 16 個月前
Wizard Vicuna 是一個 13B 參數模型,基於 Llama 2,由 MelodysDreamj 訓練。
29.6K 提取次數 17 標籤 更新於 16 個月前
EXAONE 3.5 是由 LG AI Research 開發和發布的一系列指令微調的雙語(英語和韓語)生成模型,參數範圍從 2.4B 到 32B。
29.3K 提取次數 13 標籤 更新於 3 個月前
一個 3.8B 模型,基於 Phi-3,在私有的高品質合成數據集上進行了微調,用於資訊提取。
26.4K 提取次數 17 標籤 更新於 7 個月前
OpenCoder 是一個開放且可重現的程式碼 LLM 系列,包含 1.5B 和 8B 模型,支援英語和中文的聊天。
26.2K 提取次數 9 標籤 更新於 3 個月前
MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的一種變體,通過將模型自身交錯創建。
25.3K 提取次數 19 標籤 更新於 14 個月前
Cohere R 系列中最小的模型,提供頂級的速度、效率和品質,以便在通用 GPU 和邊緣設備上構建強大的 AI 應用程式。
24.7K 提取次數 5 標籤 更新於 7 週前
一個頂級效能的專家混合模型,使用高品質數據進行了微調。
24.4K 提取次數 18 標籤 更新於 14 個月前
Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合併。專為聊天和程式碼生成而設計。
23.9K 提取次數 17 標籤 更新於 16 個月前
一個 7B 聊天模型,使用高品質數據進行微調,並基於 Zephyr。
23.7K 提取次數 18 標籤 更新於 14 個月前
一個語言模型,通過將兩個微調的 Llama 2 70B 模型組合而成。
23K 提取次數 16 標籤 更新於 16 個月前
由 Bespoke Labs 開發的最先進的事實查核模型。
22.7K 提取次數 17 標籤 更新於 5 個月前
IBM Granite Embedding 30M 和 278M 模型是純文本密集雙編碼器嵌入模型,其中 30M 僅提供英語版本,而 278M 適用於多語言用例。
21.6K 提取次數 6 標籤 更新於 2 個月前
Tülu 3 是一個領先的指令遵循模型系列,由 Allen Institute for AI 提供完全開源的數據、程式碼和配方。
20.3K 提取次數 9 標籤 更新於 2 個月前
一個緊湊而高效的視覺語言模型,專為視覺文件理解而設計,能夠從表格、圖表、資訊圖表、繪圖、示意圖等自動提取內容。
20K 提取次數 5 標籤 更新於 13 天前
一個基於 Llama 3 的開放權重函數呼叫模型,與 GPT-4o 的函數呼叫能力相競爭。
19.1K 提取次數 17 標籤 更新於 7 個月前
DBRX 是 Databricks 創建的一個開放式通用 LLM。
18.4K 提取次數 7 標籤 更新於 11 個月前
Granite-3.2 是 IBM Granite 的長上下文 AI 模型系列,經過微調以增強思考能力。
17.5K 提取次數 9 標籤 更新於 2 週前
IBM Granite Guardian 3.0 2B 和 8B 模型旨在檢測提示和/或回應中的風險。
16.7K 提取次數 10 標籤 更新於 3 個月前
DeepSeek-R1 模型的一個版本,由 Perplexity 進行後訓練,以提供公正、準確和真實的資訊。
16.4K 提取次數 9 標籤 更新於 2 週前
一個強大的對話模型,設計用於聊天和指令用例。
15.9K 下載次數 7 標籤 更新於 15 個月前
Sailor2 是為東南亞設計的多語言語言模型。提供 1B、8B 和 20B 參數大小的版本。
9,822 下載次數 13 標籤 更新於 3 個月前
Command R7B 輕量級模型的最新版本,在進階阿拉伯語能力方面表現出色,適用於中東和北非的企業。
3,433 下載次數 5 標籤 更新於 12 天前