目前單一 GPU 上最強大的模型。

10億 40億 120億 270億

23.9K 6 小時前

自述檔案

Google Gemma 3 logo

此模型需要 Ollama 0.6 或更高版本。下載 Ollama

Gemma 是 Google 基於 Gemini 技術開發的輕量級模型系列。Gemma 3 模型是多模態的—處理文字和圖像—並具有 128K 上下文視窗,支援超過 140 種語言。它們提供 10億、40億、120億 和 270億參數大小,擅長問答、摘要和推理等任務,而其緊湊的設計允許部署在資源有限的裝置上。

模型

文字

10億參數模型(32k 上下文視窗)

ollama run gemma3:1b 

多模態(視覺)

40億參數模型(128k 上下文視窗)

ollama run gemma3:4b

120億參數模型(128k 上下文視窗)

ollama run gemma3:12b

270億參數模型(128k 上下文視窗)

ollama run gemma3:27b

評估

Chatbot Arena ELO Score

基準測試結果

這些模型已針對大量不同的資料集和指標進行評估,以涵蓋文字生成的多個面向

推理、邏輯和程式碼能力

基準 指標 Gemma 3 PT 10億 Gemma 3 PT 40億 Gemma 3 PT 120億 Gemma 3 PT 270億
HellaSwag 10-shot 62.3 77.2 84.2 85.6
BoolQ 0-shot 63.2 72.3 78.8 82.4
PIQA 0-shot 73.8 79.6 81.8 83.3
SocialIQA 0-shot 48.9 51.9 53.4 54.9
TriviaQA 5-shot 39.8 65.8 78.2 85.5
Natural Questions 5-shot 9.48 20.0 31.4 36.1
ARC-c 25-shot 38.4 56.2 68.9 70.6
ARC-e 0-shot 73.0 82.4 88.3 89.0
WinoGrande 5-shot 58.2 64.7 74.3 78.8
BIG-Bench Hard 28.4 50.9 72.6 77.7
DROP 3-shot, F1 42.4 60.1 72.2 77.2
AGIEval 3-5-shot 22.2 42.1 57.4 66.2
MMLU 5-shot, top-1 26.5 59.6 74.5 78.6
MATH 4-shot 24.2 43.3 50.0
GSM8K 5-shot, maj@1 1.36 38.4 71.0 82.6
GPQA 9.38 15.0 25.4 24.3
MMLU (Pro) 5-shot 11.2 23.7 40.8 43.9
MBPP 3-shot 9.80 46.0 60.4 65.6
HumanEval pass@1 6.10 36.0 45.7 48.8
MMLU (Pro COT) 5-shot 9.7 NaN NaN NaN

多語言能力

基準 Gemma 3 PT 10億 Gemma 3 PT 40億 Gemma 3 PT 120億 Gemma 3 PT 270億
MGSM 2.04 34.7 64.3 74.3
Global-MMLU-Lite 24.9 57.0 69.4 75.7
Belebele 26.6 59.4 78.0
WMT24++ (ChrF) 36.7 48.4 53.9 55.7
FloRes 29.5 39.2 46.0 48.8
XL-Sum 4.82 8.55 12.2 14.9
XQuAD (全部) 43.9 68.0 74.5 76.8

多模態能力

基準 Gemma 3 PT 40億 Gemma 3 PT 120億 Gemma 3 PT 270億
COCOcap 102 111 116
DocVQA (驗證集) 72.8 82.3 85.6
InfoVQA (驗證集) 44.1 54.8 59.4
MMMU (pt) 39.2 50.3 56.1
TextVQA (驗證集) 58.9 66.5 68.6
RealWorldQA 45.5 52.2 53.9
ReMI 27.3 38.5 44.8
AI2D 63.2 75.2 79.0
ChartQA 45.4 60.9 63.8
ChartQA (擴增) 81.8 88.5 88.7
VQAv2
BLINK 38.0 35.9 39.6
OKVQA 51.0 58.7 60.2
TallyQA 42.5 51.8 54.3
SpatialSense VQA 50.9 60.0 59.4
CountBenchQA 26.1 17.8 68.0