FlashAttention-v1回顾
我们先快速回顾一下V1的运作流程:以K,V为外循环,Q为内循环。
FlashAttention-v2
FlashAttention V2 出自论文(《FlashAttention-2: Faster
2024-12-10