BiFormer: Vision Transformer with Bi-Level Routing Attention
前言 今天介紹的這篇是 vision transformer 領域的一篇論文,作者的主要貢獻是提出 Bi-Level Routing Attention, 這種 attention 使得 query 可以
3 minutes to read