一個精巧且高效的視覺語言模型,專為視覺文件理解而設計,能夠從表格、圖表、資訊圖表、繪圖、示意圖等自動提取內容。
vision 工具 2b
19.4K 提取次數 更新於 12 天前
更新於 12 天前
12 天前
9b6204ce60f6 · 3.6GB
模型
架構granite
·
參數2.53B
·
量化Q8_0
2.7GB
投影器
架構clip
·
參數442M
·
量化F16
893MB
參數
{ "num_ctx": 16384, "temperature": 0 }
34B
系統
好奇的使用者與人工智慧助理之間的對話。助理會給予有幫助的,
154B
模板
{{- /* Tools */ -}} {{- if .Tools -}} <|start_of_role|>available_tools<|end_of_role|> {{- range $in
1.3kB
許可證
Apache License Version 2.0, January 2004
11kB
說明文件
注意:此模型需要 Ollama 0.5.13。
一個精巧且高效的視覺語言模型,專為視覺文件理解而設計,能夠從表格、圖表、資訊圖表、繪圖、示意圖等自動提取內容。此模型在經過精心策劃的指令遵循資料集上訓練,該資料集包含多樣化的公開資料集和為支援廣泛的文件理解和一般圖像任務而量身定制的合成資料集。它通過微調 Granite 大型語言模型以及圖像和文字模態進行訓練。