24:注意力机制与 Transformer

在本课程中,我们结束了对无条件 Stable Diffusion 模型的探索。然后,我们实现无条件模型,在 Fashion MNIST 上进行训练,并讨论时间嵌入的重要性。我们还深入探讨了正弦和余弦嵌入、注意力机制、自注意力机制以及在 Stable Diffusion 背景下的多头注意力机制。我们讨论了 rearrange 函数、Transformer 以及它们在视觉任务中的潜在用途。最后,我们通过在 UNet 模型的输入中添加标签来创建一个条件模型,使其能够生成特定类别的图像。

讨论的概念

  • 实现无条件 Stable Diffusion 模型
  • 时间嵌入与正弦/余弦嵌入
  • 自注意力机制与多头注意力机制
  • Rearrange 函数
  • Transformer
  • 创建条件 Stable Diffusion 模型

视频