一個基於 Llama 3 Instruct 微調的 LLaVA 模型,在多項基準測試中獲得更佳的分數。

vision 8b

265.6K 9 months ago

Readme

llava-llama3 是一個 LLaVA 模型,基於 Llama 3 Instruct 和 CLIP-ViT-Large-patch14-336,並使用 XTuner 透過 ShareGPT4V-PT 和 InternVL-SFT 進行微調。

References

Hugging Face

GitHub