DeepSeek 的第一代推理模型,效能與 OpenAI-o1 相提並論,包括從 DeepSeek-R1 基於 Llama 和 Qwen 提煉出的六個密集模型。
7.7M 下載次數 28 標籤 更新時間 13 days ago
全新最先進的 70B 模型。Llama 3.3 70B 提供與 Llama 3.1 405B 模型相近的效能。
1.1M 下載次數 14 標籤 更新時間 8 weeks ago
Phi-4 是微軟推出的 14B 參數、最先進的開放模型。
310.4K 下載次數 5 標籤 更新時間 3 weeks ago
Meta 的 Llama 3.2 推出 1B 和 3B 小型模型。
8.1M 下載次數 63 標籤 更新時間 4 months ago
Llama 3.1 是 Meta 推出的全新最先進模型,提供 8B、70B 和 405B 參數尺寸。
21.9M 下載次數 93 標籤 更新時間 2 months ago
一個高效能的開放嵌入模型,具有大型 token 上下文視窗。
14M 下載次數 3 標籤 更新時間 11 months ago
由 Mistral AI 發布的 7B 模型,已更新至 0.3 版本。
8.5M 下載次數 84 標籤 更新時間 6 months ago
Meta Llama 3:目前功能最強大的公開 LLM。
7.4M 下載次數 68 標籤 更新時間 8 months ago
Qwen 1.5 是阿里巴巴雲推出的一系列大型語言模型,參數規模從 0.5B 到 110B。
4.3M 下載次數 379 標籤 更新時間 9 months ago
Gemma 是 Google DeepMind 建構的輕量級、最先進開放模型系列。已更新至 1.1 版本。
4.3M 下載次數 102 標籤 更新時間 10 months ago
Qwen2 是阿里巴巴集團推出的全新大型語言模型系列。
4.1M 下載次數 97 標籤 更新時間 4 months ago
Qwen2.5 模型在阿里巴巴最新的大規模資料集上進行預訓練,涵蓋多達 18 兆個 token。該模型支援高達 128K 個 token,並具有多語言支援。
3.6M 下載次數 133 標籤 更新時間 4 months ago
Llama 2 是一系列基礎語言模型,參數規模從 7B 到 70B。
2.9M 下載次數 102 標籤 更新時間 13 months ago
🌋 LLaVA 是一種新穎的端對端訓練大型多模態模型,結合了視覺編碼器和 Vicuna,用於通用的視覺和語言理解。已更新至 1.6 版本。
2.9M 下載次數 98 標籤 更新時間 12 months ago
Phi-3 是微軟推出的輕量級 3B (Mini) 和 14B (Medium) 最先進開放模型系列。
2.9M 下載次數 72 標籤 更新時間 6 months ago
Google Gemma 2 是一個高效能且高效率的模型,提供三種尺寸:2B、9B 和 27B。
2.5M 下載次數 94 標籤 更新時間 6 months ago
最新的程式碼專用 Qwen 模型系列,在程式碼生成、程式碼推理和程式碼修復方面有顯著改進。
1.9M 下載次數 196 標籤 更新時間 2 months ago
一個大型語言模型,可以使用文字提示來生成和討論程式碼。
1.7M 提取次數 199 標籤 更新於 6 個月前
TinyLlama 專案是一個開放的計畫,旨在訓練一個精巧的 1.1B Llama 模型,使用 3 兆個 tokens。
1.3M 提取次數 36 標籤 更新於 13 個月前
mixedbread.ai 最先進的大型嵌入模型
1.2M 提取次數 4 標籤 更新於 9 個月前
Mistral AI 與 NVIDIA 合作打造,最先進的 12B 模型,具有 128k 上下文長度。
1.1M 提取次數 17 標籤 更新於 6 個月前
Llama 3.2 Vision 是一系列經過指令微調的圖像推理生成模型,具有 11B 和 90B 兩種尺寸。
1M 提取次數 9 標籤 更新於 2 個月前
StarCoder2 是下一代透明訓練的開放程式碼 LLM,提供三種尺寸:3B、7B 和 15B 參數。
831.7K 提取次數 67 標籤 更新於 5 個月前
Snowflake 提供的一套文字嵌入模型,針對效能進行了最佳化。
604.3K 提取次數 16 標籤 更新於 9 個月前
Mistral AI 提供的一組具有開放權重的專家混合 (MoE) 模型,參數尺寸為 8x7b 和 8x22b。
545.1K 提取次數 70 標籤 更新於 6 週前
一個開源的專家混合程式碼語言模型,在程式碼特定任務中達到與 GPT4-Turbo 相媲美的效能。
536.4K 提取次數 64 標籤 更新於 5 個月前
基於 Mixtral 專家混合模型,經過微調的無審查 8x7b 和 8x22b 模型,擅長程式碼編寫任務。由 Eric Hartford 創建。
489.4K 提取次數 70 標籤 更新於 6 週前
Phi-2:微軟研究院推出的 2.7B 語言模型,展現了卓越的推理和語言理解能力。
480.3K 提取次數 18 標籤 更新於 13 個月前
CodeGemma 是一系列功能強大、輕量級的模型,可以執行各種程式碼編寫任務,例如填空中程式碼完成、程式碼生成、自然語言理解、數學推理和指令遵循。
476.7K 提取次數 85 標籤 更新於 6 個月前
DeepSeek Coder 是一個功能強大的程式碼編寫模型,使用兩兆個程式碼和自然語言 tokens 進行訓練。
469.9K 提取次數 102 標籤 更新於 13 個月前
George Sung 和 Jarrad Hope 開發的無審查 Llama 2 模型。
458.9K 提取次數 34 標籤 更新於 15 個月前
微軟 AI 最先進的大型語言模型,在複雜的聊天、多語言、推理和代理使用案例中具有更佳的效能。
349.9K 提取次數 22 標籤 更新於 9 個月前
基於 Mistral 的無審查 Dolphin 模型,擅長程式碼編寫任務。已更新至 2.8 版本。
312.8K 提取次數 120 標籤 更新於 10 個月前
BGE-M3 是 BAAI 的新型模型,以其在多功能性、多語言性和多粒度方面的多樣性而著稱。
288.6K 提取次數 3 標籤 更新於 6 個月前
在非常大的句子級別資料集上訓練的嵌入模型。
280.2K 提取次數 10 標籤 更新於 9 個月前
Dolphin 2.9 是 Eric Hartford 基於 Llama 3 開發的新模型,具有 8B 和 70B 兩種尺寸,並具備多種指令、對話和程式碼編寫技能。
277.1K 提取次數 53 標籤 更新於 8 個月前
Command R 是一個大型語言模型,針對對話互動和長上下文任務進行了最佳化。
275K 提取次數 32 標籤 更新於 5 個月前
一個通用模型,參數範圍從 30 億到 700 億,適用於入門級硬體。
268.3K 提取次數 119 標籤 更新於 15 個月前
一個從 Llama 3 Instruct 微調而來的 LLaVA 模型,在多項基準測試中獲得更好的分數。
265.5K 提取次數 4 標籤 更新於 9 個月前
Yi 1.5 是一個高效能、雙語語言模型。
261.2K 提取次數 174 標籤 更新於 8 個月前
Hermes 3 是 Nous Research 旗艦 Hermes 系列 LLM 的最新版本
249.8K 提取次數 65 標籤 更新於 7 週前
Zephyr 是一系列 Mistral 和 Mixtral 模型的微調版本,經過訓練可作為有用的助手。
233.2K 提取次數 40 標籤 更新於 9 個月前
一個輕量級 AI 模型,具有 38 億個參數,其效能超越了相似和更大尺寸的模型。
229.9K 提取次數 17 標籤 更新於 5 個月前
Codestral 是 Mistral AI 首款專為程式碼生成任務設計的程式碼模型。
205K 提取次數 17 標籤 更新於 5 個月前
StarCoder 是一個在 80 多種程式語言上訓練的程式碼生成模型。
181.4K 提取次數 100 標籤 更新於 15 個月前
IBM 開放基礎模型系列,用於程式碼智慧
181.2K 提取次數 162 標籤 更新於 5 個月前
基於 Llama 和 Llama 2 的通用聊天模型,上下文大小為 2K 到 16K。
172.5K 提取次數 111 標籤 更新於 15 個月前
Wizard Vicuna Uncensored 是一個基於 Llama 2 的 7B、13B 和 30B 參數模型,由 Eric Hartford 開發,未經審查。
171.6K 提取次數 49 標籤 更新於 15 個月前
🪐 一系列小型模型,具有 135M、360M 和 1.7B 參數,在新的高品質資料集上訓練。
169K 提取次數 94 標籤 更新於 5 個月前
Mistral OpenOrca 是一個 70 億參數模型,在 Mistral 7B 模型之上使用 OpenOrca 資料集進行了微調。
164.8K 提取次數 17 標籤 更新於 16 個月前
一個強大的專家混合(MoE)語言模型,總參數為 671B,每個 token 激活 37B。
159.4K 提取次數 5 標籤 更新於 3 週前
QwQ 是一個實驗性研究模型,專注於提升 AI 推理能力。
153.9K 提取次數 5 標籤 更新於 2 個月前
SmolLM2 是一系列精巧的語言模型,提供三種尺寸:135M、360M 和 1.7B 參數。
153.7K 提取次數 49 標籤 更新於 3 個月前
基於 Llama 2 的模型,經過微調以提升中文對話能力。
146K 提取次數 35 標籤 更新於 15 個月前
一系列在各種資料上訓練的開源模型,在多項基準測試中超越了 ChatGPT。已更新至 3.5-0106 版本。
136.6K 提取次數 50 標籤 更新於 13 個月前
一個適用於 AI 軟體開發情境的多功能模型,包括程式碼完成。
133.8K 提取次數 17 標籤 更新於 7 個月前
由 Cohere 發布的 Aya 23 是一個新的最先進多語言模型系列,支援 23 種語言。
130.9K 下載次數 33 標籤 更新於 8 個月前
CodeQwen1.5 是一個在大量程式碼資料上預訓練的大型語言模型。
126.4K 下載次數 30 標籤 更新於 7 個月前
Nous Research 強大的模型系列,擅長科學討論和程式碼編寫任務。
120.2K 下載次數 33 標籤 更新於 13 個月前
Mistral Large 2 是 Mistral 全新的旗艦模型,在程式碼生成、數學和推理方面能力顯著提升,具備 128k 上下文視窗並支援數十種語言。
119K 下載次數 32 標籤 更新於 2 個月前
Stable Code 3B 是一個程式碼模型,具有指令和程式碼補全變體,與 Code Llama 7B 等模型相當,但模型規模小了 2.5 倍。
117K 下載次數 36 標籤 更新於 10 個月前
OpenHermes 2.5 是由 Teknium 在 Mistral 上微調的 7B 模型,使用完全開放的資料集。
117K 下載次數 35 標籤 更新於 13 個月前
Command R+ 是一個強大、可擴展的大型語言模型,專為在真實世界的企業用例中表現出色而打造。
116.9K 下載次數 21 標籤 更新於 5 個月前
一個使用 2 兆雙語 tokens 精心打造的先進語言模型。
116.6K 下載次數 64 標籤 更新於 14 個月前
一個實驗性的 11 億參數模型,由 Eric Hartford 基於 TinyLlama,在新 Dolphin 2.8 資料集上訓練而成。
115.5K 下載次數 18 標籤 更新於 12 個月前
一個強大的多語言通用語言模型,性能可與 Llama 3 相媲美。
115.3K 下載次數 32 標籤 更新於 7 個月前
Qwen2 Math 是基於 Qwen2 LLMs 构建的一系列專業數學語言模型,其數學能力顯著優於開源模型,甚至閉源模型(例如 GPT4o)。
114.4K 下載次數 52 標籤 更新於 5 個月前
最先進的程式碼生成模型
114.3K 下載次數 67 標籤 更新於 13 個月前
BakLLaVA 是一個多模態模型,由 Mistral 7B 基礎模型組成,並使用 LLaVA 架構進行擴增。
105.6K 下載次數 17 標籤 更新於 13 個月前
Stable LM 2 是一個最先進的 16 億和 120 億參數語言模型,使用多語言資料進行訓練,語言包括英語、西班牙語、德語、義大利語、法語、葡萄牙語和荷蘭語。
105.1K 下載次數 84 標籤 更新於 9 個月前
一系列為視覺語言理解而設計的多模態 LLMs (MLLMs)。
102.5K 下載次數 17 標籤 更新於 2 個月前
一個高性能模型,使用一種名為 Reflection-tuning 的新技術進行訓練,該技術教導 LLM 檢測其推理中的錯誤並糾正方向。
102.1K 下載次數 17 標籤 更新於 4 個月前
一個強大、經濟高效的專家混合語言模型。
102K 下載次數 34 標籤 更新於 7 個月前
moondream2 是一個小型視覺語言模型,旨在在邊緣設備上高效運行。
100.8K 下載次數 18 標籤 更新於 9 個月前
一個基於 Mistral 微調的模型,在領域和語言方面具有良好的覆蓋範圍。
99.6K 下載次數 50 標籤 更新於 13 個月前
Mistral Small 3 在 70B 以下的「小型」大型語言模型類別中樹立了新的基準。
96.5K 下載次數 21 標籤 更新於 4 天前
此模型將 LLama-3 8B 的上下文長度從 8k 擴展到超過 100 萬個 tokens。
96K 下載次數 35 標籤 更新於 9 個月前
專注於數學和邏輯問題的模型
96K 下載次數 64 標籤 更新於 13 個月前
NVIDIA 基於 Llama 3 的模型,擅長對話式問答 (QA) 和檢索增強生成 (RAG)。
88.3K 提取次數 35 標籤 更新於 8 個月前
SQLCoder 是一個程式碼自動完成模型,在 StarCoder 上進行微調,用於 SQL 生成任務
86.9K 提取次數 48 標籤 更新於 12 個月前
基於 Llama 2 的對話模型,在各種基準測試中表現出色。
83.2K 提取次數 80 標籤 更新於 15 個月前
Dolphin 模型系列的 7B 和 15B 非審查變體,基於 StarCoder2,擅長編碼。
81K 提取次數 35 標籤 更新於 10 個月前
Nous Research 基於 Llama 和 Llama 2 的通用模型。
80.9K 提取次數 63 標籤 更新於 15 個月前
基於 Code Llama 的程式碼生成模型。
80K 提取次數 49 標籤 更新於 13 個月前
Llama 2 的延伸版本,支援高達 128k tokens 的上下文。
77.7K 提取次數 67 標籤 更新於 15 個月前
一款精巧但功能強大的 10.7B 大型語言模型,專為單輪對話而設計。
76.2K 提取次數 32 標籤 更新於 13 個月前
Starling 是一個大型語言模型,通過來自 AI 反饋的強化學習進行訓練,專注於提高聊天機器人的實用性。
75.5K 提取次數 36 標籤 更新於 10 個月前
基於 Llama 2 的通用模型。
75.4K 提取次數 73 標籤 更新於 15 個月前
一個基於 Phi 3 Mini 微調的新型小型 LLaVA 模型。
72.9K 提取次數 4 標籤 更新於 9 個月前
Yi-Coder 是一系列開源程式碼語言模型,以少於 100 億個參數提供最先進的編碼效能。
72.8K 提取次數 67 標籤 更新於 4 個月前
Athene-V2 是一個 72B 參數模型,擅長程式碼自動完成、數學和日誌提取任務。
70K 提取次數 17 標籤 更新於 2 個月前
InternLM2.5 是一個 7B 參數模型,專為實際場景量身定制,具有出色的推理能力。
70K 提取次數 65 標籤 更新於 5 個月前
技術創新研究所 (TII) 構建的大型語言模型,用於摘要、文本生成和聊天機器人。
67.2K 提取次數 38 標籤 更新於 15 個月前
一位在哲學、心理學和人際關係方面接受過訓練的伴侶助理。基於 Mistral。
67.1K 提取次數 49 標籤 更新於 15 個月前
Orca 2 由微軟研究院構建,是 Meta 的 Llama 2 模型的微調版本。該模型旨在特別擅長推理。
61.2K 提取次數 33 標籤 更新於 14 個月前
Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 客製化的大型語言模型,旨在提高 LLM 生成的回應用戶查詢的實用性。
60.7K 提取次數 17 標籤 更新於 3 個月前
NVIDIA 出品的商業友善小型語言模型,針對角色扮演、RAG QA 和函數調用進行了優化。
59.3K 提取次數 17 標籤 更新於 4 個月前
Eric Hartford 開發的 2.7B 非審查 Dolphin 模型,基於微軟研究院的 Phi 語言模型。
59.2K 提取次數 15 標籤 更新於 13 個月前
基於 Llama 2 模型微調的 Orca 風格資料集。原名 Free Willy。
58.1K 提取次數 49 標籤 更新於 15 個月前
Wizard LM 模型的非審查版本
57.5K 提取次數 18 標籤 已更新 15 months ago
Dolphin 3.0 Llama 3.1 8B 🐬 是下一代 Dolphin 系列指令微調模型,旨在成為終極通用本地模型,實現程式碼編寫、數學、代理性、函數呼叫和一般使用情境。
55.5K 提取次數 5 標籤 已更新 4 weeks ago
Groq 系列模型,代表開源 AI 在工具使用/函數呼叫功能方面的顯著進展。
46.8K 提取次數 33 標籤 已更新 6 months ago
IBM Granite 2B 和 8B 模型是純文本密集型 LLM,訓練數據超過 12 兆 tokens,在 IBM 的初步測試中,效能和速度均顯著優於其前代模型。
46.3K 提取次數 33 標籤 已更新 2 weeks ago
IBM Granite 2B 和 8B 模型旨在支援基於工具的使用情境,並支援檢索增強生成 (RAG),簡化程式碼生成、翻譯和錯誤修復。
45.5K 提取次數 33 標籤 已更新 2 months ago
微調的 Llama 2 模型,基於開源醫療數據集回答醫療問題。
44.9K 提取次數 17 標籤 已更新 15 months ago
Llama 2 的延伸模型,專門整合一般語言理解和領域特定知識,尤其在程式設計和數學方面。
44.6K 提取次數 33 標籤 已更新 13 months ago
Mistral 的延伸模型,支援 64K 或 128K 的上下文窗口。
44.5K 提取次數 33 標籤 已更新 15 months ago
開源醫療大型語言模型,改編自 Llama 2 以應用於醫療領域。
44.2K 提取次數 22 標籤 已更新 14 months ago
Nexus Raven 是一個 13B 指令微調模型,用於函數呼叫任務。
40.8K 提取次數 32 標籤 已更新 12 months ago
Nous Research 的 Nous Hermes 2 模型,現在基於 Mixtral 進行訓練。
37.4K 提取次數 18 標籤 已更新 6 weeks ago
一個新的小型推理模型,基於 Qwen 2.5 3B Instruct 模型進行微調。
37.1K 提取次數 5 標籤 已更新 5 weeks ago
基於 Llama2 的出色程式碼生成模型。
36.2K 提取次數 19 標籤 已更新 15 months ago
未經審查的 Llama2 基礎模型,支援 16K 上下文窗口。
35.6K 提取次數 18 標籤 已更新 13 months ago
IBM Granite 1B 和 3B 模型是 IBM 首批混合專家 (MoE) Granite 模型,專為低延遲使用而設計。
34.5K 提取次數 33 標籤 已更新 2 months ago
Cohere For AI 的語言模型,經過訓練在 23 種不同語言中表現出色。
33K 提取次數 33 標籤 已更新 3 months ago
🎩 Magicoder 是一個 7B 參數模型系列,使用 OSS-Instruct 訓練於 75K 合成指令數據,OSS-Instruct 是一種啟發 LLM 的創新方法,採用開源程式碼片段。
31.3K 提取次數 18 標籤 已更新 14 months ago
Falcon2 是一個 11B 參數的因果解碼器專用模型,由 TII 構建,並在超過 5T tokens 的數據上進行訓練。
31.1K 提取次數 17 標籤 已更新 8 months ago
輕量級聊天模型,允許精確且反應靈敏的輸出,而無需高階硬體。
30.7K 提取次數 17 標籤 已更新 13 months ago
高效能程式碼指令模型,通過合併兩個現有的程式碼模型而創建。
30.4K 提取次數 16 標籤 已更新 15 months ago
BAAI 的嵌入模型,將文本映射到向量。
30.3K 提取次數 3 標籤 已更新 6 months ago
MathΣtral:Mistral AI 設計的 7B 模型,專為數學推理和科學發現而設計。
29.9K 下載次數 17 標籤 更新於 6 months ago
OLMo 2 是一個全新的 7B 和 13B 模型系列,使用高達 5T 個 tokens 進行訓練。這些模型與同等大小的完全開放模型相當或更優越,並且在英文學術基準測試中與 Llama 3.1 等開放權重模型具有競爭力。
29K 下載次數 9 標籤 更新於 3 weeks ago
MistralLite 是一個基於 Mistral 微調的模型,增強了處理長上下文的能力。
28.9K 下載次數 17 標籤 更新於 15 months ago
Wizard Vicuna 是一個由 MelodysDreamj 訓練,基於 Llama 2 的 13B 參數模型。
一系列將 HTML 內容轉換為 Markdown 內容的模型,適用於內容轉換任務。
28.7K 下載次數 33 標籤 更新於 4 months ago
由 MotherDuck 和 Numbers Station 製作的 7B 參數 text-to-SQL 模型。
28.5K 下載次數 17 標籤 更新於 12 months ago
一系列參數小於 10B 的高效 AI 模型,透過創新的訓練技術,在科學、數學和編碼方面表現出色。
28.4K 下載次數 17 標籤 更新於 6 weeks ago
阿里巴巴國際數字商業集團 (AIDC-AI) 開發的開放大型推理模型,用於真實世界的解決方案。
28K 下載次數 5 標籤 更新於 2 months ago
Solar Pro 預覽版:一個先進的大型語言模型 (LLM),具有 220 億參數,設計為可容納在單個 GPU 中。
27.4K 下載次數 18 標籤 更新於 4 months ago
MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的轉換版本,透過將模型自身交錯而成。
24.8K 下載次數 19 標籤 更新於 13 months ago
一個頂尖效能的專家混合模型,使用高品質資料進行微調。
23.8K 下載次數 18 標籤 更新於 13 months ago
ShieldGemma 是一組指令微調模型,用於評估文本提示輸入和文本輸出響應針對一組已定義安全策略的安全性。
23.3K 下載次數 49 標籤 更新於 3 months ago
Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合併版本。專為聊天和程式碼生成而設計。
23.2K 下載次數 17 標籤 更新於 15 months ago
一個 7B 聊天模型,使用高品質資料進行微調,並基於 Zephyr。
23.1K 下載次數 18 標籤 更新於 13 months ago
一個語言模型,透過將兩個微調後的 Llama 2 70B 模型組合而成。
22.7K 下載次數 16 標籤 更新於 14 months ago
Llama Guard 3 是一系列為 LLM 輸入和響應的內容安全分類而微調的模型。
21.6K 下載次數 33 標籤 更新於 3 months ago
由 Bespoke Labs 開發的最先進的事實查核模型。
21K 下載次數 17 標籤 更新於 4 months ago
IBM Granite 1B 和 3B 模型是 IBM 的長上下文專家混合 (MoE) Granite 模型,專為低延遲使用而設計。
20.6K 下載次數 33 標籤 更新於 2 weeks ago
一個 3.8B 模型,基於 Phi-3,在私有的高品質合成資料集上進行微調,用於資訊提取。
20.1K 下載次數 17 標籤 更新於 6 months ago
OpenCoder 是一個開放且可重現的程式碼 LLM 系列,包含 1.5B 和 8B 模型,支援英語和中文聊天。
20K 下載次數 9 標籤 更新於 2 months ago
Snowflake 的前沿嵌入模型。Arctic Embed 2.0 增加了多語言支援,同時不犧牲英語效能或可擴展性。
19.2K 下載次數 3 標籤 更新於 2 months ago
DeepSeek-V2 的升級版本,整合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和編碼能力。
18.6K 下載次數 7 標籤 更新於 4 months ago
一個基於 Llama 3 的開放權重函數呼叫模型,在函數呼叫能力上與 GPT-4o 競爭。
17.9K 下載次數 17 標籤 更新於 6 months ago
DBRX 是 Databricks 創建的開放通用 LLM。
17.6K 下載次數 7 標籤 更新於 9 months ago
EXAONE 3.5 是 LG AI Research 開發和發布的一系列指令微調雙語(英語和韓語)生成模型,參數範圍從 2.4B 到 32B。
17.5K 下載次數 13 標籤 更新於 8 週前
Sentence-transformers 模型,可用於集群或語義搜尋等任務。
17.2K 下載次數 3 標籤 更新於 6 個月前
一個強大的對話式模型,專為聊天和指令用途而設計。
14.9K 下載次數 7 標籤 更新於 14 個月前
Cohere R 系列中最小的模型,提供頂尖的速度、效率和品質,以便在通用 GPU 和邊緣裝置上建構強大的 AI 應用。
13.7K 下載次數 5 標籤 更新於 2 週前
Tülu 3 是領先的指令遵循模型系列,由艾倫人工智慧研究院提供完全開源的資料、程式碼和配方。
13.7K 下載次數 9 標籤 更新於 6 週前
IBM Granite Guardian 3.0 2B 和 8B 模型設計用於偵測提示和/或回應中的風險。
13.6K 下載次數 10 標籤 更新於 2 個月前
IBM Granite Embedding 30M 和 278M 模型是純文字密集雙編碼器嵌入模型,30M 版本僅提供英文,而 278M 版本則支援多語言使用情境。
11.3K 下載次數 6 標籤 更新於 6 週前
Sailor2 是專為東南亞設計的多語言模型。提供 1B、8B 和 20B 等參數規模。
5,526 下載次數 13 標籤 更新於 2 個月前