最新的 70B 模型。Llama 3.3 70B 提供與 Llama 3.1 405B 模型相似的效能。
1.1M Pulls 14 Tags Updated 8 週前
Meta 的 Llama 3.2 以 1B 和 3B 模型走向小型化。
8.1M Pulls 63 Tags Updated 4 個月前
Llama 3.1 是 Meta 最新的先進模型,提供 8B、70B 和 405B 參數大小。
21.9M Pulls 93 Tags Updated 2 個月前
由 Mistral AI 發布的 7B 模型,已更新至 0.3 版本。
8.5M Pulls 84 Tags Updated 6 個月前
Qwen2 是阿里巴巴集團推出的全新大型語言模型系列
4.1M Pulls 97 Tags Updated 4 個月前
Qwen2.5 模型在阿里巴巴最新的大規模數據集上進行預訓練,包含多達 18 兆個 tokens。該模型最多支援 128K tokens,並具有多語言支援。
3.6M Pulls 133 Tags Updated 4 個月前
最新的程式碼專用 Qwen 模型系列,在程式碼生成、程式碼推理和程式碼修復方面有顯著改進。
1.9M Pulls 196 Tags Updated 2 個月前
一款先進的 12B 模型,具有 128k 上下文長度,由 Mistral AI 與 NVIDIA 合作建構。
1.1M Pulls 17 Tags Updated 6 個月前
Mistral AI 開放權重的專家混合 (MoE) 模型組,具有 8x7b 和 8x22b 參數大小。
545.1K Pulls 70 Tags Updated 6 週前
Command R 是一款針對對話互動和長上下文任務優化的大型語言模型。
275K Pulls 32 Tags Updated 5 個月前
Hermes 3 是 Nous Research 旗艦 Hermes 系列 LLM 的最新版本。
249.8K Pulls 65 Tags Updated 7 週前
QwQ 是一款實驗性研究模型,專注於提升 AI 推理能力。
153.9K Pulls 5 Tags Updated 2 個月前
SmolLM2 是一個精巧型語言模型系列,提供三種大小:135M、360M 和 1.7B 參數。
153.7K Pulls 49 Tags Updated 3 個月前
Mistral Large 2 是 Mistral 全新的旗艦模型,在程式碼生成、數學和推理方面能力顯著提升,具有 128k 上下文視窗,並支援數十種語言。
119K Pulls 32 Tags Updated 2 個月前
Command R+ 是一款強大、可擴展的大型語言模型,專為在真實世界的企業用例中脫穎而出而打造。
116.9K Pulls 21 Tags Updated 5 個月前
Mistral Small 3 在 70B 以下的「小型」大型語言模型類別中樹立了新的基準。
96.5K Pulls 21 Tags Updated 4 天前
Athene-V2 是一款 72B 參數模型,擅長程式碼完成、數學和日誌提取任務。
70K 下載次數 17 標籤 更新於 2 個月前
Llama-3.1-Nemotron-70B-Instruct 是由 NVIDIA 客製化的大型語言模型,旨在提升 LLM 針對使用者查詢所產生回應的實用性。
60.7K 下載次數 17 標籤 更新於 3 個月前
由 NVIDIA 開發的商業友善小型語言模型,針對角色扮演、RAG QA 和函數呼叫進行了最佳化。
59.3K 下載次數 17 標籤 更新於 4 個月前
Groq 公司推出的一系列模型,代表開源 AI 在工具使用/函數呼叫能力方面的重大進展。
46.8K 下載次數 33 標籤 更新於 6 個月前
IBM Granite 2B 和 8B 模型是純文字密集型 LLM,使用超過 12 兆個 tokens 的資料進行訓練,在 IBM 的初步測試中,效能和速度相較於前代產品有顯著提升。
46.3K 下載次數 33 標籤 更新於 2 週前
IBM Granite 2B 和 8B 模型旨在支援基於工具的使用案例,並支援檢索增強生成(RAG),簡化程式碼生成、翻譯和錯誤修復。
45.5K 下載次數 33 標籤 更新於 2 個月前
IBM Granite 1B 和 3B 模型是 IBM 首批混合專家 (MoE) Granite 模型,專為低延遲使用而設計。
34.5K 下載次數 33 標籤 更新於 2 個月前
Cohere For AI 的語言模型,經過訓練後能在 23 種不同語言中表現良好。
33K 下載次數 33 標籤 更新於 3 個月前
IBM Granite 1B 和 3B 模型是 IBM 的長上下文混合專家 (MoE) Granite 模型,專為低延遲使用而設計。
20.6K 下載次數 33 標籤 更新於 2 週前
一個基於 Llama 3 的開放權重函數呼叫模型,在函數呼叫能力上可與 GPT-4o 匹敵。
17.9K 下載次數 17 標籤 更新於 6 個月前
Cohere R 系列中最小的模型,提供頂級的速度、效率和品質,以便在通用 GPU 和邊緣設備上建構強大的 AI 應用程式。
13.7K 下載次數 5 標籤 更新於 2 週前