Minigpt-4
使用高级大型语言模型增强视觉语言理解
模型
MiniGPT-4 由一个带有预训练 ViT 和 Q-Former 的视觉编码器、一个线性投影层和一个高级 Vicuna 大型语言模型组成。 MiniGPT-4 只需要训练线性层将视觉特征与 Vicuna 对齐。 :
MiniGPT-4的架构
MiniGPT-4 由一个带有预训练 ViT 和 Q-Former 的视觉编码器、一个线性投影层和一个高级 Vicuna 大型语言模型组成。 MiniGPT-4 只需要训练线性层将视觉特征与 Vicuna 对齐。 :
MiniGPT-4的架构