視覺Transformer(ViT)發(fā)展綜述
計算機科學
頁數(shù): 16 2024-10-12
摘要: 視覺Transformer(Vision Transformer, ViT)是基于編碼器-解碼器結構的Transformer改進模型,已經被成功應用于計算機視覺領域。近幾年基于ViT的研究層出不窮且效果顯著,基于該模型的工作已經成為計算機視覺任務的重要研究方向,因此針對近年來ViT的發(fā)展進行概述。首先,簡要回顧了ViT的基本原理及遷移過程,并分析了ViT模型的結構特點和優(yōu)勢;然... (共16頁)
開通會員,享受整站包年服務