一個基於 Llama 3 Instruct 微調的 LLaVA 模型,在多個基準測試中獲得更好的分數。

視覺 8b

265.6K 9 個月前

讀我檔案

llava-llama3 是一個基於 Llama 3 Instruct 和 CLIP-ViT-Large-patch14-336 微調的 LLaVA 模型,使用了 ShareGPT4V-PT 和 InternVL-SFT 透過 XTuner 進行微調。

參考文獻

Hugging Face

GitHub