Minigpt-4

使用高级大型语言模型增强视觉语言理解

 

模型

MiniGPT-4 由一个带有预训练 ViT 和 Q-Former 的视觉编码器、一个线性投影层和一个高级 Vicuna 大型语言模型组成。 MiniGPT-4 只需要训练线性层将视觉特征与 Vicuna 对齐。 :

Minigpt-4

MiniGPT-4的架构

相关导航

分享