一個基於 Llama 3 Instruct 微調的 LLaVA 模型,在多個基準測試中獲得更好的分數。

視覺 8b

265.5K 9 months ago

讀我

llava-llama3 是一個基於 Llama 3 Instruct 和 CLIP-ViT-Large-patch14-336 微調的 LLaVA 模型,使用了 XTuner 的 ShareGPT4V-PT 和 InternVL-SFT 數據集。

參考文獻

Hugging Face

GitHub