一個強大的混合專家 (MoE) 語言模型,總共有 6710 億個參數,每個 token 啟用 370 億個參數。
671b
15.94萬 次下載 更新於 3 週前
5 個標籤
5da0e2d4a9e0 • 404GB • 3 週前
5da0e2d4a9e0 • 404GB • 3 週前
7770bf5a5ed8 • 1.3TB • 3 週前
5da0e2d4a9e0 • 404GB • 3 週前
96061c74c1a5 • 713GB • 3 週前