一個基於 Llama 3 Instruct 微調的 LLaVA 模型,在多項基準測試中獲得更佳的分數。

vision 8b

449K 10 個月前

說明文件

llava-llama3 是一個 LLaVA 模型,由 XTuner 基於 Llama 3 Instruct 和 CLIP-ViT-Large-patch14-336,使用 ShareGPT4V-PT 和 InternVL-SFT 進行微調。

參考資料

Hugging Face

GitHub