分类: 深度学习 | 庞贝堡垒

Pompeii BL

文章分类

3D重建 1 git 1 image-processing 1 Linux 1 深度学习 1 docker 3 hexo 2 python 2 vscode 1 transformer 1 google search console 1 Latex 1 CG 1 LLMs 7 机器学习 1 《大模型动力引擎》阅读笔记 8 LLMs 1 线性代数 1 生活 1 杂谈 1 Prompt 1 docker 1 网络配置 1 美食 1

BLIP2 & Q-former

BLIP2 & Q-former

Q-former 是 BLIP2 中提出的一个模块，目的在于从视觉编码器中提取出与文本最相关的视觉表示，而这种表示能够为大语言模型所解释。 1.BLIP2 1.1 组成 BLIP-2 由以下三个主要组件组成： Image Encoder：

2025-03-27 深度学习

Q-former BLIP2