「Flutter系列①」从Widget到Layer:引擎与渲染管线解析
A3C 算法原理与超级马里奥实践(下)
A3C 算法原理与超级马里奥实践(上)
DQN(Deep Q-Network)系列算法解析与实践
PPO算法在连续与离散动作空间中的案例实践
强化学习 — PPO策略优化算法
强化学习 — 试错、策略与长期奖励
从像素到区域:MaskFormer 系列详解
ViT — Transformer在视觉领域应用代码解析
1.ViT概述
在上一篇文章中主要讲了 Transformer 的基本原理,尤其是在自然语言处理(NLP)任务中的应用,包括编码器和解码器的主要功能和注意力机制的具体实现。但这些内容大多基于 NLP 领域的示例,本篇我们看看在计算机视觉(CV)领域,Transformer 在图像任务中的使用方式。