24:注意力机制与 Transformer
在本课程中,我们结束了对无条件 Stable Diffusion 模型的探索。然后,我们实现无条件模型,在 Fashion MNIST 上进行训练,并讨论时间嵌入的重要性。我们还深入探讨了正弦和余弦嵌入、注意力机制、自注意力机制以及在 Stable Diffusion 背景下的多头注意力机制。我们讨论了 rearrange
函数、Transformer 以及它们在视觉任务中的潜在用途。最后,我们通过在 UNet 模型的输入中添加标签来创建一个条件模型,使其能够生成特定类别的图像。
讨论的概念
- 实现无条件 Stable Diffusion 模型
- 时间嵌入与正弦/余弦嵌入
- 自注意力机制与多头注意力机制
- Rearrange 函数
- Transformer
- 创建条件 Stable Diffusion 模型