QwQ 是 Qwen 系列的推理模型。
868.3K 下載次數 8 標籤 更新於 6 days ago
最新的最先進 70B 模型。Llama 3.3 70B 提供與 Llama 3.1 405B 模型相似的效能。
1.5M 下載次數 14 標籤 更新於 3 months ago
Meta 的 Llama 3.2 以 1B 和 3B 模型走向小型化。
10.4M 下載次數 63 標籤 更新於 5 months ago
Llama 3.1 是 Meta 最新的最先進模型,提供 8B、70B 和 405B 參數尺寸。
26.7M 下載次數 93 標籤 更新於 3 months ago
Mistral AI 發布的 7B 模型,已更新至 0.3 版本。
10.2M 下載次數 84 標籤 更新於 7 months ago
Qwen2.5 模型在阿里巴巴最新的大規模資料集上進行預訓練,包含多達 18 兆個 tokens。該模型最多支援 128K 個 tokens,並具有多語言支援。
5.2M 下載次數 133 標籤 更新於 5 months ago
最新的程式碼專用 Qwen 模型系列,在程式碼生成、程式碼推理和程式碼修復方面有顯著改進。
4.5M 下載次數 196 標籤 更新於 4 months ago
Qwen2 是阿里巴巴集團新推出的大型語言模型系列
4.1M 下載次數 97 標籤 更新於 6 months ago
Mistral AI 與 NVIDIA 合作構建的最先進 12B 模型,具有 128k 上下文長度。
1.3M 下載次數 17 標籤 更新於 7 months ago
Mistral AI 開源權重的專家混合 (MoE) 模型集,具有 8x7b 和 8x22b 參數尺寸。
582.7K 下載次數 70 標籤 更新於 2 months ago
SmolLM2 是一個小型語言模型系列,提供三種尺寸:135M、360M 和 1.7B 參數。
371.5K 下載次數 49 標籤 更新於 4 months ago
Mistral Small 3 在 70B 以下的「小型」大型語言模型類別中,設立了新的基準。
298.5K 下載次數 21 標籤 更新於 5 weeks ago
Command R 是一個針對對話互動和長上下文任務優化的大型語言模型。
283K 下載次數 32 標籤 更新於 6 months ago
Hermes 3 是 Nous Research 旗艦 Hermes 系列 LLM 的最新版本
264.7K 下載次數 65 標籤 更新於 2 months ago
Mistral Large 2 是 Mistral 的新旗艦模型,在程式碼生成、數學和推理方面顯著更強大,具有 128k 上下文視窗並支援數十種語言。
125.1K 下載次數 32 標籤 更新於 3 months ago
Command R+ 是一款功能強大、可擴展的大型語言模型,專為在真實世界的企業用例中表現出色而打造。
119.7K 下載次數 21 標籤 更新於 6 個月前
IBM Granite 2B 和 8B 模型是純文字稠密型 LLM,基於超過 12 兆 tokens 的資料進行訓練,在 IBM 的初始測試中,效能和速度都展現出比其前代產品顯著的提升。
81.8K 下載次數 33 標籤 更新於 7 週前
Athene-V2 是一款 72B 參數模型,在程式碼自動完成、數學和日誌提取任務方面表現出色。
76.9K 下載次數 17 標籤 更新於 3 個月前
NVIDIA 推出的商業友善小型語言模型,針對角色扮演、RAG 問答和函式呼叫進行了優化。
69.9K 下載次數 17 標籤 更新於 5 個月前
Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 客製化的大型語言模型,旨在提升 LLM 生成回應對於使用者查詢的實用性。
66.9K 下載次數 17 標籤 更新於 4 個月前
IBM Granite 2B 和 8B 模型旨在支援基於工具的用例,並支援檢索增強生成 (RAG),從而簡化程式碼生成、翻譯和錯誤修復。
57.9K 下載次數 33 標籤 更新於 3 個月前
Groq 的一系列模型,代表了開源 AI 在工具使用/函式呼叫功能方面的顯著進展。
56.2K 下載次數 33 標籤 更新於 7 個月前
Cohere For AI 的語言模型,經訓練後可在 23 種不同的語言中表現良好。
46.6K 下載次數 33 標籤 更新於 4 個月前
IBM Granite 1B 和 3B 模型是 IBM 推出的首批混合專家模型 (MoE) Granite 模型,專為低延遲使用而設計。
44.4K 下載次數 33 標籤 更新於 3 個月前
IBM Granite 1B 和 3B 模型是 IBM 推出的長上下文混合專家模型 (MoE) Granite 模型,專為低延遲使用而設計。
35.5K 下載次數 33 標籤 更新於 7 週前
Phi-4-mini 在多語言支援、推理和數學方面帶來了顯著的增強,並且現在終於支援期待已久的函式呼叫功能。
32.1K 下載次數 5 標籤 更新於 11 天前
Cohere R 系列中最小的模型,提供頂級的速度、效率和品質,以便在常用型 GPU 和邊緣裝置上建構強大的 AI 應用程式。
24.5K 下載次數 5 標籤 更新於 7 週前
一款精巧高效的視覺語言模型,專為視覺化文件理解而設計,能夠從表格、圖表、資訊圖表、繪圖、示意圖等自動提取內容。
19.3K 下載次數 5 標籤 更新於 12 天前
一款基於 Llama 3 的開源權重函式呼叫模型,可與 GPT-4o 函式呼叫功能相媲美。
19K 下載次數 17 標籤 更新於 7 個月前
Granite-3.2 是 IBM Granite 的長上下文 AI 模型系列,針對思考能力進行了微調。
16.9K 下載次數 9 標籤 更新於 2 週前
輕量級 Command R7B 模型的全新最先進版本,為中東和北非地區的企業提供卓越的進階阿拉伯語功能。
3,373 下載次數 5 標籤 更新於 11 天前