一款精巧且高效的視覺語言模型,專為視覺文件理解而設計,能夠自動從表格、圖表、資訊圖表、繪圖、示意圖等中提取內容。
vision tools 2b
19.3K Pulls Updated 12 days ago
更新於 12 天前
12 天前
3be41a661804 · 2.4GB
model
archgranite
·
parameters2.53B
·
quantizationQ4_K_M
1.5GB
projector
archclip
·
parameters442M
·
quantizationF16
893MB
params
{ "num_ctx": 16384, "temperature": 0 }
34B
system
一個好奇的使用者與人工智慧助理之間的對話。 該助理提供有幫助的、
154B
template
{{- /* Tools */ -}} {{- if .Tools -}} <|start_of_role|>available_tools<|end_of_role|> {{- range $in
1.3kB
license
Apache License Version 2.0, January 2004
11kB
Readme
注意:此模型需要 Ollama 0.5.13。
一款精巧且高效的視覺語言模型,專為視覺文件理解而設計,能夠自動從表格、圖表、資訊圖表、繪圖、示意圖等中提取內容。 此模型在精心策劃的指令遵循資料集上進行訓練,該資料集包含多樣化的公共資料集和為支援廣泛的文件理解和一般圖像任務而量身定制的合成資料集。 它通過使用圖像和文字模態微調 Granite 大型語言模型進行訓練。