granite3.2-vision:2b-fp16 - Ollama 框架

granite3.2-vision

一個精巧且高效的視覺語言模型，專為視覺文件理解而設計，能夠從表格、圖表、資訊圖表、繪圖、示意圖等自動提取內容。

視覺工具 2b

19.4K 提取次數更新於 12 天前

更新於 12 天前

12 天前

17ca6aa97bd9 · 6.0GB

{ "num_ctx": 16384, "temperature": 0 }

一個好奇的使用者和人工智慧助理之間的對話。該助理提供有幫助的，

{{- /* 工具 */ -}} {{- if .Tools -}} <|start_of_role|>available_tools<|end_of_role|> {{- range $in

Apache License Version 2.0, January 2004

自述文件

注意：此模型需要 Ollama 0.5.13。

一個精巧且高效的視覺語言模型，專為視覺文件理解而設計，能夠從表格、圖表、資訊圖表、繪圖、示意圖等自動提取內容。該模型在一個精心策劃的指令遵循數據集上進行訓練，該數據集包含多樣化的公共數據集和為支援廣泛的文件理解和通用圖像任務而客製化的合成數據集。它通過微調 Granite 大型語言模型以及圖像和文字模態進行訓練。

參考文獻