一個基於 Llama 3 Instruct 微調的 LLaVA 模型,在多項基準測試中獲得更佳的分數。

視覺 8b

265.6K 9 個月前

Readme

llava-llama3 是一個 LLaVA 模型,基於 Llama 3 Instruct 和 CLIP-ViT-Large-patch14-336,使用 XTuner,並透過 ShareGPT4V-PT 和 InternVL-SFT 進行微調。

參考文獻

Hugging Face

GitHub